分类筛选
分类筛选:

中文类有关专升本毕业论文范文 和中文十级难题,AI怎样解读方面专升本毕业论文范文

版权:原创标记原创 主题:中文范文 类别:发表论文 2024-02-11

《中文十级难题,AI怎样解读》

本文是中文方面论文写作技巧范文和难题和解读和中文相关硕士论文范文。

在人工智能领域,“懂语言者得天下”是普遍共识.其中,可帮助人工智能识别人类语言的NLP被誉为“上的明珠”.

当人工智能自然语言处理技术遇到“要你管和不要你管”“掉地上和掉地下”“我一把把把把住了”等中文“绕口令”,“小意思”“意思意思”等多义词,以及“俺们”“中不中”等方言时,该怎样“听懂”这些“中文十级”语句呢?在成都举办的科大讯飞“未来科栈”活动上,记者采访了相关专家.

能分词会断句机器尚在努力

NLP就是让计算机来理解和处理人类自然语言的技术,它和计算机视觉、语音处理的区别在于信息处理的类型.

“计算机视觉主要处理图像,语音技术处理声音,而NLP主要是对文字的理解.”云浮科技的创始人兼CEO张文斌说,在人工智能中,语音识别是“耳朵”,语音合成是“嘴巴”,计算机视觉是“眼睛”,而NLP则负责将抽象的文字符号转化为计算机能理解的语言.

“‘中文十级’的某些语句,人类去理解都有很大难度,何况是计算机!”张文斌说,在口语和书写上,汉字往往没有词与词之间的边界,即便机器能够准确识别文字,但理解其意思也很难.再比如五花八门的地方口音和方言,也是机器正确理解意思的“绊脚石”.“自然语言处理一般从最小的语意单位‘词’开始,即分词算法.这最简单,也最成熟.”张文斌说,NLP的算法分为语法级别分析、句子级别分析等.其中,“分词”就是将字词“切开”,让机器明白哪几个字组成一个词,哪几个词组成一句话,从而理解整句、整段的意思.但是,在“分词”的应用过程中,仍然存在各种各样的问题.

张文斌解释,首先是分词标准不确定、存在歧义,此外还有新词等问题.如“乒乓球,拍卖完了”和“乒乓球拍,卖完了”两种切分都正确,这就要依赖上下文语境进行正确切分.其次,每年都会涌现出网络词汇,像“神马”“不明觉厉”“佛系”等原来不存在的词也需要计算机理解.

听语气判关系AI有新招

如何让机器读懂上下文语境,从而进一步了解整段话的含意?

“我们会尝试利用听人类说话时的停顿信息,作为一种分词算法的辅助.”讯飞翻译业务负责人翟吉博说.

对于AI工程师们来说,更重要的是深层次的算法,如实体识别、属性抽取等.“就是把人名、地名、机构名等实体识别出来后,再抽取实体之间的关系,搞清楚不同实体在句子中的不同属性.”张文斌说,五花八门的算法还有很多.比如:情感分析,分析文本里面蕴藏了什么样的情感,是正面、负面还是中性的;文档摘 要,把长文生成一两百字的简短摘 要;等等.基于这些算法层,又可以做很多NLP的衍生应用,包括自动问答、机器翻译等.

那如何识别方言呢?在科大讯飞的新款翻译机设备中,首次推出方言翻译功能,实现河南话、东北话、粤语等方言互译,或将之翻译成外语.

翟吉博说,针对不同类型的方言,机器采用不同翻译流程———对同属北方方言区的河南话、东北话等,可先翻译成普通话再翻译成外语;对于粤语等南方语言,则建立独立的语料库,直接从粤语到外语进行翻译.“考虑到方言中带有许多地方特色的说法、词汇,像‘雄起’‘中不中’等也可以作为独立的语料,由机器单独学习.”他说,人工智能的优势是在自然语言处理方面能够不断从用户处积累语料,学习新的词汇和表达方式,不断完成自身数据库和语料库的更新.

(责任编校曾向宇)

中文论文参考资料:

中文期刊目录

中文论文格式

北大中文期刊

中文期刊数据库

中文毕业论文

中文论文翻译成英文

总结:本文是关于难题和解读和中文方面的相关大学硕士和中文本科毕业论文以及相关中文论文开题报告范文和职称论文写作参考文献资料。

和你相关的