战斗民族如何战胜谷歌,在人工智能领域取得一
、百度、微软、Facebook、阿里……我们介绍过很多中美在技术和商业化方面的进展,包括印度、以色列等等地区也出现过不少创业团队。
可这里面似乎没有战斗民族俄罗斯什么事。按理说,俄罗斯有在冷战时代遗留下来的大量科技人才储备,国家对数学、计算机等学科的基础教育也足够重视,强大的黑客团队展示了俄罗斯人资技术上能达到的种种可能。而且天寒地冻的气候,好像也挺适合在家宅着撸代码的。
放眼俄罗斯、甚至整个东欧地区,在最活跃的可能就是Yandex了。
Yandex:把搜索引擎当做技术发展的根本
Yandex是谁大多数人第一反应是俄罗斯的“百度”。
没错,在1990年,来自莫斯科大学的两位校友阿卡季·弗洛日和阿卡季·勃可夫斯基共同创建了俄罗斯自己的搜索引擎Yandex。“Yandex”一词俄语含义是“Языковой index”(语言索引),是英语单词“Yet Another indexer”的缩写。意味“另一种搜索引擎”。从名字就能感受到两位创始人对英语世界的反抗。
建立了搜索引擎后,Yandex逐渐开始发展为一家全能型的互联网公司:建立门户网站、创立电商平台、与联邦储蓄银行Sberbank合作推广线上支付、代理来自中国的4399小游戏、推出打车平台……基本你能想到的风口,Yandex都没错过。
和、百度一样,搜索引擎成了Yandex收集语料数据、着手机器学习技术发展的根本。
战斗民族在人工智能上发展?
Yandex在机器学习方面都做了什么
首先,是时下最火的无人驾驶。据称Yandex正在着手研发无人驾驶需要的计算机视觉、语音识别等等相关的技术。目前Yandex选择了丰田普锐斯作为原型车,加上英伟达的芯片、Velodyne的雷达传感器,目标向L5级的无人驾驶冲击。
几个月以前,Yandex还晒出了旗下无人驾驶车的场地测试视频,视频中无人车的表现中规中矩,虽然实现了在无人控制的情况下缓慢驾驶,但也会有难以越过障碍、躲避行人不及时等情况。
Yandex为自己定下了目标,明年要让丰田普锐斯上公共道路测试,同时还和卡车制造商Kamaz、Daimler达成合作,计划推出无人驾驶的迷你公交车。坦白讲,Yandex对于自身无人驾驶技术的披露相当少,俄罗斯本土是否有无人驾驶必备的高精地图也不得而知,俄罗斯的无人驾驶究竟会发展成什么样,目前很难下个定论。
除了无人驾驶,Yandex还“有样学样”的推出了语音助手Alice,以此展示自己的语音识别技术。和Siri、谷歌语音助手一样,Alice可以帮助用户连接出行、购物、支付、新闻、音乐等等服务。
Yandex还给Alice加上了基于神经网络的聊天引擎,让Alice可以在社交网络上学习他人的言论,这一技术的确较为先进。在测试中,Alice甚至还学会了一些政治、暴力方面的不当言论,不过在问题曝光后,这些言论很快被技术和谐了。
除了这些以外,Yandex还开源了机器学习框架Catboost、推出了深度神经网络搜索引擎等等。
分词技术:本土搜索引擎的神器
我们想了解到的是,Yandex是战胜谷歌搜索,还在自然语言方面了相对前沿的进展。答案或许是因为Yandex独有的分词技术。
所谓分词技术,其实是中文搜索引擎中的技术。即搜索引擎针对用户提交查询的关键词串进行的查询处理后根据用户的关键词串用各种匹配方法进行分词的一种技术。
比如在搜索引擎中搜“不知道你在说什么”,就可能分成“不,知道,你,在,说什么”和“不知道,你,在,说什么”等等很多种分法,再到数据库中进行索引。