来源:华中科技大学
埃塞俄比亚联邦民主共和国大使馆
向华中科技大学致函
特别感谢学校对
埃塞俄比亚籍电信学院2019级博士研究生
王兴WONDIMU GEBRE DIKUBAB
的培养与帮助
以及对进一步增进中埃两国之间友谊
作出的贡献
近日,在人工智能与自动化学院教授、测控技术“一带一路”联合实验室副主任白翔的指导下,王兴发布了首个阿姆哈拉语场景文字检测与识别综合公共数据集和初步的算法解决方案。其论文“Comprehensive Benchmark Datasets for Amharic Scene Text Detection and Recognition”发表在国内计算机领域顶级期刊SCIENCE CHINA Information Sciences上。
埃塞俄比亚联邦民主共和国是非洲大陆最古老的非殖民化独立国家之一,也是非洲第二大人口大国,是中国“一带一路”倡议的积极参与者与推动者。阿姆哈拉语是埃塞俄比亚的官方工作语言,也是仅次于阿拉伯语的第二大闪米特语系,在世界范围内有着广泛应用。埃塞俄比亚/阿姆哈拉文字(Abugida)是非洲最古老的书写系统之一,被应用于东非的至少23种语言中,共计被超过1.2亿人使用。对基于阿姆哈拉语的文字图片进行识别,将有助于促进东非国家在办公、交通、旅游等相关领域的数字化智能化转型。
基于阿姆哈拉语的文字图片识别是一项极具挑战性的任务。为了解决构成阿姆哈拉语的不同字母具有高度的视觉相似性、目前缺乏公开的面向非洲文字理解的文字数据集等难点,王兴在白翔的指导下,提出了首个全面的、公开的阿姆哈拉文字识别数据集,数据集分为HUST-ART、HUST-AST、A.B.E.和Tana四个部分,总共包含了15039张真实场景的文字图像以及2927682张合成的文字图像。针对该数据集,王兴与合作者设计了大量实验,以评估应用目前最先进的文字识别方法在该数据集中识别阿姆哈拉语文字的性能。
论文被SCIENCE CHINA Information Sciences接收后,相关成果及数据在网络上公开发布,受到了广泛关注。该工作的贡献对于阿姆哈拉语的技术发展是里程碑式的,将直接促进埃塞俄比亚官方语言和其他非洲语言的文字识别应用。
自1996年以来,华中科技大学电信学院持续开展来华留学教育,实现了本、硕、博贯通式培养,累计培养国际学生超过1000人。经过不断的探索与实践,电信学院不断完善培养模式和体系,国际学生的培养质量稳步提升。
助力“一带一路”倡议
促进国际交流共谋科技发展
华中大人
始终在前行!