网站首页 > 人工智能AI > 人工智能应用 对话美团AI视觉专家:GPU计算平台升级,AI效率提高百倍 正文

对话美团AI视觉专家:GPU计算平台升级,AI效率提高百倍

admin 2020/03/02 人工智能应用 104℃

人工智能

[db:标签]不觉[db:标签]人工智能已经渗透到生活的各个方面,甚至包括我们所知道的食品和饮料。

从商人的菜单项,招牌识别到自动生成的AI的首次图像优化推广,外卖骑手的身份验证.美团AI视觉功能已渗透到其所有方面商业。

▲美团视觉影像中心影像与视频组负责人魏小明

近日,智之来到美团北京总部进行了与美国宣教视觉图像中心视频小组的负责人魏小明。深入的对话,对美国代表团视觉AI功能的全面解释,美国代表团视觉AI平台的开发以及美国代表团视觉AI背后的“电厂”。

一、从菜单录入到AI选图,AI无处不在

魏小明表示,与许多其他公司不同,美国集团的AI技术具有强大的面向业务的功能。

目前,美团的AI技术主要分为四类:基于AI的语音/语义理解技术,基于AI的视觉处理技术以及基于运营计划的分配调度优化。以及基于自动驾驶无人驾驶配送技术。

▲Mei AI视觉布局

魏小明是美国Mission Visual Image Center图像和视频小组的负责人。他在视觉领域拥有超过9年的研发和技术管理经验。他先前曾在佳能工作。研究所和三星研究院。

吴晓明在2015年加入美国集团后领导了50多个AI视觉项目。在采访中,魏晓明从商人,骑手,用户和平台的角度介绍了美团的典型AI视觉应用场景。

▲AI菜单图片输入

美团AI可以让商家通过图片进入菜单,通过文本检测,语义分割,视觉关系学习等技术提取纸张。菜单上的结构化信息使商家菜单的时间从小时减少到分钟。

▲AI招牌识别

随着OCR技术的不断发展,菜单识别和招牌识别等分割场景已成为当前OCR领域的研究热点。在今年的ICDAR 2019上,美国代表团举办了业界首个中文面对面标牌游戏(ICDAR 2019在招牌上阅读中文文本时进行了稳健的阅读挑战),并发布了业界首个真实世界的签名图像数据集。

此外,商家的文件资格认证,车手的面部识别,用户的AI菜识别小程序,广告第一图片优化,车手采样等,都具有美人组AI的视野。祝福。

魏小明说,目前,美国集团有数万名技术人员,美国AI视觉中心有数十名员工,并且团队规模还在不断扩大。

二、GPU计算平台全面升级,效率提高百倍

美国集团的AI视觉团队开始为AI的各种业务建立AI视觉功能(例如图像查看,智能选择等)群组。 2015-2016年可以看作是美国集团AI视觉平台发展的第一步。

随着该群体对AI计算能力的需求猛增,美团在2017年对企业级计算平台进行了全面升级,从基于CPU的计算平台升级到NVIDIA GPU。 2017-2018年的集群式AI计算平台可以视为美国集团AI视觉平台的第二个开发阶段。

升级到基于NVIDIA Tesla V100 GPU的集群式AI计算平台后,美团AI可以在文本检测,人脸识别和产品识别的离线培训中实现数百倍。提高效率。

就应用程序推断而言,当前基于NVIDIA Tesla P4 GPU + TensorRT的美国Mission可将计算效率提高数十倍。而且,美国集团目前使用FP32精度,如果将来将NVIDIA T4 Tensor Core GPU用于FP16精度推断计算,性能将得到进一步提高。这种低延迟,高实时计算性能对于用户和交付人员的体验非常重要。

例如,为了保护用户的安全,目前美国任务日的70万车手已经完全涵盖了“刷脸认证”功能。但是,此功能会向骑手添加验证过程,这会影响效率和体验。

因此,为了确保骑手的面部比较效率,美国团队使用了基于GPU并行+ TensorRT的方案进行大规模的骑手面部比较身份验证。与基于CPU的解决方案相比,该解决方案可以加速20倍以上,并且速度的提高可以使外卖兄弟的“刮脸认证”过程更快,体验更好。

魏小明说,目前,美国任务服务器集群的AI视觉服务的平均每日通话次数已达数亿次。

三、美团AI的下一步

在2018年,随着美团计算平台的升级,美团的AI视野已经超大型,涵盖了菜单上面提到的身份识别,人脸认证,人脸支付,广告生成以及许多其他内部应用场景。

▲美国团队在CVPR2019-FGVC6产品识别竞赛中获得第二名

自2019年以来,美国团队的AI视觉团队不仅支持AI组内的需求它也在主要的国际比赛中逐渐表达出来。 2019年,美国宣教团的AI视觉团队在CVPR,ICME和其他视觉知名比赛中获得前三名。

魏小明认为,当前的AI算仍处于快速迭代过程中。对于诸如Meituan的大型平台,多个深度学习框架(如TensorFlow,Caffe和MXNet)的连续迭代可以提高计算并行化的效率,这对于优化Meituan的特定AI场景非常重要。

接下来,美国AI视觉团队还将扩展AI场景,例如视频理解,商店数字化和无人值守分发系统。

结语:AI应用全面爆发,实时性要求不断提高

在AI应用爆发之后,许多公司都在升级AI计算平台,尤其是与面部认证和照片信息检索有关的实时要求。对于高AI推理应用程序,传统的计算平台已不再足够。

不知不觉中,人工智能逐渐渗透到我们生活的方方面面。不经意间,您可能会喜欢AI带来的生活便利。

严禁未经正式授权转载本文,侵权行为将受到调查。
网站地图