本篇文章603字,读完约2分钟
科学技术日报记者张盖伦
有被称为ocr界奥斯卡的icdar比赛,世界近100个国家的数千支队伍参加了。 最近,来自中国的阿里巴巴一举刷新了icdar-rctw17拷贝检测和端到端拷贝识别两个世界最好成绩。
ocr、光学文字识别是从图像中自动检测和识别拷贝的技术。 icdar是进行场景拷贝检测和识别任务的最有名、最常用的数据集,icdar-rctw17关注中文场景的浏览。
ocr的应用前景广阔。 除用于复印翻译、扫描文件阅读等办公场景、自动驾驶等工业场景外,还可以识别大量图像和视频中的低俗新闻,识别大量商品中涉嫌不法行为的标志,可以说是数字经济时代社会管理的新基础设施。
阿里安全高级算法专家薛晖表示,这项广泛应用于阿里经济的技术正在不断迭代升级,以处理许多纷繁复杂的社会问题。 三年前,蚂蚁ocr识别技术每秒可扫描文字2000万个,相当于501本《康熙词典》,识别精度达到97.6%。
其实,ocr只是蚂蚁知识产权保护技术大脑中的技术之一。 “大脑”包含数亿个商品特征、一百多个算法模型,效率相当于5万人,从事。 在今年疫情期间,为了不怎么跑公共服务、执法监管等方面的力量,减少感染风险,阿里迅速升级了知产保护科技的大脑技术,提高了ai的造假能力,输出了疫情防控的相关算法模型。 迄今为止,阿里安全协助全国14个省30个地市公安机关侦查销售假冒口罩等违法案件128起,在科技战“疫情”中发挥作用。
标题:“这项刷新世界最好成绩的OCR技术,也被用于疫情中的打假”
地址:http://www.5e8e.com/hlw/22500.html