一品慧诚 - 智汇一品集团旗下品牌
logo

四个月申请5项全国专利 94年阿里安全工程师独立研发全国首个AI模特系统

2020/12/29 15:04:36
作者:
人气:0

  12月初,全国首个AI模特系统“塔玑”在阿里平台治理部的原创保护平台上线,商家上传服装平铺图并选择人脸、表情、妆容、身型后,算法会自动生成模特图,可大幅节省商家上新成本。但人们肯定想不到,这个申请了5项全国发明专利的“塔玑”的算法部分,是一位94年的阿里安全图灵实验室高级算法工程师独立研发出来的。

  图说:商家只需上传服装平铺图,“塔玑”会自动生成虚拟模特的实拍图

  他叫国安,父亲、岳父和妻子都是理工科博士,以超过普通博士4倍的学术成绩硕士毕业于北理工。他说,是宽松自由开放的家庭环境、学校科研环境和阿里的研发环境造就了自己。

  “现在我们的技术在努力帮助中小商家低成本实现高质量的‘卖家秀’,未来我们还想让更多消费者能无碍购物,实现优质的‘买家秀’。”国安说。

  以博士4倍的学术成绩硕士毕业

  国安今年26岁,北京理工大学计算机图像处理专业硕士毕业。国安笑称,自己是家里学历最低的人:他的父亲、岳父是理工科博士学历,妻子是中科院在读化学分析博士,母亲是理工科双硕士学历。

  父母没有强压给国安任何期许,玩电子游戏是他从小的最大爱好。三四岁时,他用一台运行着Win95系统的电脑第一次玩电子游戏——超级玛丽,从那时对计算机产生浓厚兴趣。

  国安凭着兴趣,理科成绩一直非常优秀,北京理工大学本科毕业后保研。

  大三时国安进入北京理工大学计算机学院副教授梁玮的实验室学习,一直到硕士毕业。期间,国安对计算机视觉和虚拟现实图形学产生了浓厚兴趣。

  不少高校实验室都要求学生必须按照自身的发展规划来。但梁玮教授没有拘泥于此,她善于引导学生的兴趣到实验室工作中。“我的实验室以学生们的兴趣点为主,只有他们感兴趣的,才能完成得出色。”

  在校期间,国安在计算机顶级会议和期刊发表了8篇论文。而北理工博士毕业标准仅要求在计算机顶级会议和期刊发表2篇论文。

  4个月研发出全国首个AI虚拟模特系统“塔玑”

  去年6月,国安通过校招到阿里图灵实验室实习,今年7月正式入职后,他开始研发AI虚拟模特系统“塔玑”。

  对淘宝上很多中小商家来说,从开始请模特拍摄到商品上架,大概需要两周,而拍摄一件衣服的成本是一两千,上新成本很高。这个系统能解决中小商家这个痛点。

  但实际上,技术难度很大。人去观看人,比人去观看物的关注度更高,稍微有点不自然就影响交互体验,而且技术涉及多个交叉领域。但这恰恰结合了国安的科研兴趣点,那8篇让同学们羡慕的论文多数都和AI虚拟图像相关。

  国安很欣慰,阿里的研发环境和北理工的学术氛围一样宽松自主。“没人强迫你加班,工作时间是被任务定义的,产品上线有时间表,你要根据日程自主倒排时间。”国安说。

  图说:国安(右二)与北京服装学院的老师一起对专业模特的姿态进行动作捕捉,为“塔玑”进行技术储备

  你也要自主地研究探索。主管华棠对国安的技术探索没有设置条条框框,只是在他迷茫的时候帮忙把握方向。研发过程其实挺磨人,因为需要不停地和参与内测的商家迭代技术。

  刚开始内测的阶段,商家对模特姿态并不是很认可,国安就推翻了第一版技术方案,但对新方案心里不完全有底。华棠支持他勇敢尝试,并且对阿里的技术优势做了深入剖析,建议他在新方案中扬长避短。

  4个月后,“塔玑”成功上线,10分钟就能生成上千张虚拟人脸,每张人脸的合成时间还不到一秒。商家只需要上传一张商品平铺图,自主选择不同的人脸、表情、妆容、身型以及图片风格,算法系统会一天内自动生成模特图、详情页给商家。

  据了解,该系统的算法已被CVPR、ACM MM和AAAI等国际顶级学术会议收录,目前已申请5项国家发明专利

  国安说,现在的工作重点是完善系统,丰富模特的身材比例,“未来我们还计划把技术用来改善淘宝的‘买家秀’,只要输入身材比例,用户看到的就是衣服穿在自己身上的效果。”

  除此之外,阿里安全图灵实验室还与北京服装学院、北京理工大学等高校合作,通过对专业模特的姿态进行动作捕捉,为下一阶段的虚拟模特短视频、虚拟主播等解决方案进行技术储备。