“无论外面社会如何左右,都对自己真诚,做真实的自己,内心没有杂念和疑问。”这句电影台词是最触动杜兰的一句话。
研究生毕业之后,杜兰进入通信行业工作,一干就是15年。此时的她已经是最年轻的部门负责人之一。2015年,科大讯飞已经用语音技术辅助生活了,于是杜兰放弃了体制内的舒适区,加入人工智能行业。她坚信“人工智能很快像水和电一样,遍及生活的方方面面”。
她与刘庆峰相识在长城上
杜兰和科大讯飞的缘分,还要从1999年说起。
1999年,26岁的刘庆峰带领十几名同学创立科大讯飞公司。同年,杜兰作为“五四奖学金”的广东省学生代表前往人民大会堂领奖。在长城上,她与刘庆峰相识,这也是她第一次跟科大讯飞结缘。
“那时,中文语音技术全部被国外巨头控制在自己手上。”杜兰当时了解到,智能语音会是一个重要的入口,可在2000年以前,IBM、微软等巨头都在中国语音技术方面进行商业布局。
“为什么中文语音技术不能够掌握在中国人手上?为什么我们不能将它做到最好?”杜兰说,就为了打破这一格局,科大讯飞的创业团队开始了漫长的攻关路。
在她看来,当时人工智能第二次浪潮接近尾声了,这时成立的科大讯飞走得较艰难。她回忆当时情景,第一年公司账面上只剩十几万元了,刘庆峰需要去借钱才能发得起工资,让员工有钱过年。
后来,科大讯飞决定调整商业模式,放弃当时的B2C模式,转向为有渠道、有市场的大公司提供核心技术的B2B业务,“接到第一个40多万元的大单,这才挺过去了。” 直到2004年,科大讯飞才做到盈亏平衡,开始进入快速发展的阶段,2008年成功登陆A股中小板。
“值得一提的是,中国语音市场的80%是掌握在我们中国人手里。”杜兰告诉记者,2015年之后,“不论是英翻汉还是汉翻英,都是我们中国人第一。”
“一年飞的里程能绕地球好几圈”
在接受媒体采访时,杜兰曾表示,在科技创业公司,女性需要学会克服“玻璃心”和“公主病”。加入科大讯飞后,杜兰就开始四处奔波,在全球范围内参加科技论坛,推广人工智能的应用。“我一年飞的里程能绕地球好几圈了”。杜兰和她的团队一路走过来,源于对工作的热爱: “我们需要坚持一个方向去做,那就是语音。”
去年11月,科技部将科大讯飞列为智能语音国家人工智能开放创新平台建设者,科大讯飞成为首批4家国家新一代人工智能开放创新平台之一。除此之外,科大讯飞负责承建科技部认知智能国家重点实验室。
截至去年12月,讯飞开放平台的累计终端数已经达到15亿,开发者团队数已达50万个,每天使用人次超过40亿。
10分钟前期音频就能完成模拟语音
如何让机器人说话,并且说的比普通人还好?
杜兰以导航软件的林志玲提示音为例。之前,如果要合成这样一条真人语音,至少需要10多个小时的林志玲音频资源,然后在后台人工进行标注。需要花费两到三个月的时间,“做到跟真人声音无差。”
随着语音合成技术的发展,现在只需要10分钟的前期音频,就能完成模拟语音。据杜兰介绍,语音技术分三个层次,初始的语音识别技术是让计算机能够“听懂”人类的语音,其次的语音合成技术是让机器像人一样开口说话,最后更显重要的核心技术是让机器学会思考。而目前科大讯飞的语音识别技术语音转写正确率已突破了85%实用门槛。
“人工智能要想强大,离不开这三项:核心算法要强,大数据要累积,行业专家来定标。”杜兰一直强调大数据的积累。她认为丰富的行业大数据是人工智能应用的基本要素,“数据足够的丰富,才会有越来越多人使用,使得后台机器越准确。”
比如在图像识别上,科大讯飞曾做了一个关于肺结核病例识别的测试,机器识别的准确率可以达到94.1%,而高准确率是需要用大数据“喂养”出来。前期机器需要对大量肺结核X片的学习以及判断,数据越多,囊括可能性越大,准确率越高。
广州将是最适合AI应用发展城市之一
杜兰表示,在未来3到5年,将会是人工智能一个重要的窗口期,中国将有很多机会。目前,在“能听会说”的感知智能领域,很多国家已经做得很好了,下一步核心技术挑战是在认知智能领域。
在谈到人工智能对人类的影响时,她再次强调“赋能”二字,人工智能应是“有了它,你能变得刚好”,而不是“取代人类”。AI+时代,不仅是从业者的时代,更是每个人的时代。
2015年,杜兰上任科大讯飞高级副总裁,将华南总部选择在广州。“广州是一座文化基础、医疗基础非常深厚的城市,这会帮助AI+教育、AI+医疗等应用取得非常好的成绩。”在她看来,广州将是最适合AI应用发展的城市之一。广州的政策支持提供了科大讯飞无限的想象空间,也给了无限的发展空间。
去年9月18日,科大讯飞与广东省人民政府正式签署了战略合作协议,将在广东省智慧政务、智慧教育、智慧医疗、智慧家庭、智慧司法、智慧公安和智能家电等领域加强合作,用人工智能建设美好广东。
■采写:新快报记者 何生廷 ■摄影:新快报记者 祝贺