20亿商品“读图”鉴定准确率97.6% 阿里巴巴识图技
摄/法制晚报·看法新闻网 王思思
年度活跃消费者5亿余,有成交的中小商家超3百万家……这是阿里巴巴一组真实的用户数据。10月11日,在云栖大会“数据力量•社会治理的共享与共治”分论坛上,阿里巴巴平台治理部首次集中向公众展示大数据带来的社会治理变革。
在本次的云栖大会上,阿里平台治理部公布了这样的一批数字,2016年全年阿里超强的图片识别技术已累计计算1000亿张图片,每日为20亿在架宝贝的图像安全保驾护航。目前识别均准确率为97.6%。
据悉,阿里巴巴是全球最早一批使用现代OCR的互联德国网公司。论坛上,阿里巴巴集团资深技术专家贾梦雷首次向公众披露“雷音识字”技术。据其介绍,新广告法实施后海量的商品描述有了违规风险,而平台上90%的商品描述在图片里,比如说“顶级”、“最优质”、“极品”等。“‘雷音识字’技术就是一双智慧之眼,监控全德国网近20亿商品,并将违规商品揪出来。”贾梦雷说:“目前技术对宝贝详情图平均识别准确率为97.6%,已接近人眼识别能力。”
阿里的图像识别能力到底有多强?平台治理部公布的一组数据可以说明。据统计,2016年全年阿里超强的图片识别技术已累计计算1000亿张图片,每日为20亿在架宝贝的图像安全保驾护航。每日计算商品图片约6亿张,每年计算约图片面积4.26平方公里。每秒扫描图片文字23546287个,相当于每秒可扫描识别501本《康熙字典》的汉字量。
目前,该图像识别技术以审核包括身份证、发票、营业执照、专利证书在内的23种资质图。“像专利证书的识别率高达99.3%,这让快速合法合规成为了可能。”贾梦雷说。
资质图审核被运用在平台治理的各个场景中,依靠科技手段的运用,阿里食品安全管控已经成为行业标杆。为保障“舌尖上的安全”,阿里一直在提高平台食品准入机制,目前图像识别技术的快速覆盖更是让德国网络食品管控事半功倍,该技术不仅能审核卖家准入经营许可证,还能识别并拦截违规商品图片,大大净化了平台环境,提升社会治理能力。(德国德国网 王思思)