寻求报道

腾讯姚星:腾讯如何做技术布局与技术应用?

饭桌君 2019年05月23日 热点
腾讯在未来的AI发展上将持续聚焦两大问题:一是多模态研究,二是通用人工智能。

5月22日,2019腾讯全球数字生态大会在昆明举行,在AI分论坛上,腾讯副总裁姚星对外披露了腾讯AI在产业互联网领域的成绩单,并详细介绍了腾讯在“两张网”上的技术布局和在智能工业、新零售、农业、智慧医疗、文旅等行业的技术应用,姚星还透露腾讯在未来的AI发展上将持续聚焦两大问题:一是多模态研究,二是通用人工智能。

以下是姚星的分享内容,小饭桌作了不影响原意的整理,以飨读者。 

大家好,非常高兴今天能在这里跟大家分享一下腾讯的前沿科技助力“两张网”。昨天论坛上面我也分享了关于前沿科技的分享,今天会细致化的详细给大家综述一下腾讯的前沿科技如何助力“两张网”。

698808 (1).png

两大矩阵:ABC到ABC2.0

在技术布局上,腾讯早已构建了人工智能(AI)、大数据(Big Data)和云计算(Cloud Computing)为基础的ABC核心技术布局。不止于此,公司还继续加大投入,迭代出AI、从虚拟到现实的机器人RoBotics、量子计算Quantum Computing的一ABC 2.0技术版本。

目前腾讯已建立两大实验室矩阵——人工智能实验室矩阵,包括致力于全面基础研究与应用的腾讯AI Lab-深圳及西雅图、基于视觉的腾讯优图、基于语音与自然语言理解WeChat AI等四大实验室;以及基于前沿科技的实验室矩阵,涵盖机器人、量子计算、5G、边缘计算、IoT和音视频技术等,打造面向未来的科技引擎,推动自主技术创新。

深耕消费互联网,拥抱产业互联网

在技术应用上,腾讯的前沿科技已经从消费互联网长期累积的经验,不断迁移到产业互联网,走出了C2B2C的特色路线。

除了消费互联网,在产业互联网,腾讯深度学习各大行业,在农业、工业、零售到医疗的各个行业建立了中国智慧方案。

智能工业领域,过往生产线检测是拍摄照片后靠人力分辨合格或缺陷产品,现在把这项技术交给人工智能去做,通过机器自动识别检测,能达到90%准确率,节约50%人力。

新零售领域,为无人商场提供了底层的基础能力:商品自动识别准确率98%,人脸无感支付一次识别通过率99%;基于Reid的路径动线分析为大型商场提供人流量的统计,准确率98%。 

农业领域已经展开探索。2018年,腾讯 AI Lab 参加由荷兰瓦赫宁根大学(WUR)主办的温室种植大赛,获 “AI策略” 单项第一、总分第二的成绩。腾讯在今年相继与中粮、广东粤旺农业集团、仲恺农业工程学院签订战略合作,布局智慧农业。明天还将宣布两大重磅消息:一、宣布跟欧洲顶级农业大学WUR合办“第二届智慧温室种植大赛”,吸引国际人才优化种植算法;二、跟农科院信息所成立智慧农业联合实验室,探索农业与AI、IoT、大数据、云计算与机器人等结合的跨学科前沿研究,打造中国智慧方案。

智慧医疗上,腾讯作为新一代人工智能创业创新平台,我们的医疗产品帮助国家100多家三甲医院累计读片一亿,进行早期的癌症筛查,我们也从中筛查出接近一百万的疑似患者,我们首推出了AI+AR技术的智能显微镜,抢先布局病理诊断领域,特别在消化道系统方面,提供的免疫蛋白阻化等技术极大的为病理科大夫进行量化诊断提供了帮助。

文旅方面,腾讯协助云南省政府打造的“一部手机游云南”APP,里面也埋藏了诸多的AI技术,包括刷脸入园、识花草、辨识场景,极大地便利了游客的体验;我们在敦煌数字壁画也做了非常多工作,对壁画的数字重建也采用了先进的AI算法,保证了文化的继续传承。

攻克核心大问题

除了技术快速落地应用,腾讯还投入并重视基础研究,立志要攻克一些价值与挑战并存的“核心大问题”。

腾讯的AI技术,一直是沿着“感知、认知、决策”这条路线去研究和发展的。

从感知来讲,更多是图像处理、语音识别,也就是人的听觉和视觉能力。视频去模糊是把原来比较模糊的东西,通过AI技术将模糊去掉变得清晰,也是看似简单,但是背后隐藏了AI的技术,这是通过对抗神经网络实现的,不是简单的分割技术,是生成器和判别器对抗的技术,我们逐步把模糊去掉。

认知部分,2018年我们在QQ空间上线图片即时语音描述功能,强化学习算法在国际顶级大赛MS COCO的该类别挑战赛上排名第一,超越微软和谷歌等公司。在中国残疾人联合会的支持下,启动AI无障碍:QQ空间无障碍技术开源项目,宣布开源图片转语音技术、OCR识别技术、语音合成技术。 

决策系统部分,围棋AI的诞生让我们看到了一丝希望。腾讯AI Lab的围棋AI产品“绝艺”先后在UEC杯、AI龙星战和腾讯世界人工智能围棋大赛上三夺世界冠军,并担任中国国家围棋队训练专用AI。它超越顶级棋手的背后依靠的就是算法,在几小时的学习里,模拟对弈创造出上几千万局高质量的棋局,这个数字超越了人类社会所产生的所有棋局数量,从而帮助机器找到或接近了围棋终极解法,从而击败了顶级人类选手。

在2018KPL秋季赛总决赛上,腾讯AI Lab的策略协作型AI“绝悟”首次露面,接受前KPL职业选手和职业解说组成的人类战队(平均水平超过99%玩家)的5V5水平测试并取得胜利。“绝悟”首先通过监督学习方法,深度模仿 KPL 职业玩家的数据;其次,会进行大量自我对战,每天的训练强度最高能达到人类150年的训练量。对战中形成了极为复杂的局面,预计有高达10的20000次方种操作可能性。若 AI 能在如此复杂的环境中,学会跟人一样实时感知、分析、理解、推理、决策到行动,就可能在多变、复杂的真实环境中发挥更大作用。因此业界认为下一个 AI 里程碑,可能会在复杂策略游戏中诞生。

未来我们怎么办呢?很多人说,AI的能力最主要是通过算法、算力和大数据,其中更取决于大数据。从我来看,数据量和算力对我们来讲总有天花板,而算法是无穷的。 

所以,腾讯在未来的AI发展上将持续聚焦两大问题:一是多模态研究,二是通用人工智能。 

第一是多模态研究,这是在探索面向未来的人机交互方式。如果类比人类智慧,感知、认知和决策其实不可分割,是一个协同、平衡和制约的问题。当我们不再只是对三个方向单一优化,而是进行跨学科、跨模态的交叉研究时,多模态研究就能让机器用感知判断人类情绪,用认知判断意图,并进行更复杂的分析与决策,从而不断向真正的人类智慧靠近。 

画面中出现的蓝色短发少女(代号T.E.G)就是腾讯多模态研究的代表,它集合了计算机视觉、语音、自然语言理解到智能决策协作等多种AI技术于一身,目标是不断逼近人类智慧。她穿梭于演唱会、体育或电竞比赛、教育课堂等不同场景,在虚拟助手、解说、老师到歌舞姬形态上具有无穷潜力。

第二是通用人工智能。现在大家所说的人工智能,就是算法、算力到大数据构成的。但从某种意义上,数据和算力将是有限的。举个例子,如果把宇宙近140亿年历史浓缩成一年,一小时是150万年,一秒钟相当于500年,整个人类文明不过10秒。想用10秒钟的人类社会数据来复刻整个宇宙的复杂度,基本上是不可能的。当数据和算力遭遇瓶颈,我们就期待有一种终极、通用、普适的算法,不断提升其水平,能够仿真复杂的世界、甚至是极度复杂的整个宇宙,这个答案可能就是通用人工智能。

找到通用人工智能,打造一种通用、普适、终极的算法,最大释放技术原力。这就是我们所说的、希望攻克的核心大问题。

开源协同 多方合作

最后,想谈一下腾讯的AI开放与合作的内容。 

我们基础研究方向主要为四个:机器学习、计算机视觉、语音处理和自然语言处理。2016年成立至今,腾讯AI Lab有超过310篇学术论文发表在各大顶级学术会议上,如NeurIPS、ICML、CVPR、ECCV、ACL、EMNLP、InterSpeech 和 ICASSP 等,位居国内企业前列。

除了发表论文公开研究成果,我们也通过代码和数据开源将腾讯积累的技术能力(尤其是 AI 能力)共享给整个行业,并希望以此促进行业生态的共同发展和繁荣。

在高校合作方面,我们与麻省理工、牛津、斯坦福、港科大、清华和哈工大等全球知名高校的教授联合研究,并通过专项研究计划、访问学者计划、青年学者基金、联合实验室等多种方式,共探学术前沿领域,并迅速将研究应用到腾讯云、腾讯开放平台等多个业务中。

今天我的分享就到这里。让AI无所不在。谢谢大家!

原文来源:小饭桌 作者:饭桌君
赞(0)
呵呵(0)
有料要爆,希望项目被报道,请点击寻求报道

热门推荐

最新文章