发布网友 发布时间:2022-04-21 23:36
共1个回答
热心网友 时间:2024-01-08 09:53
弗莱德里克贾里尼克是语音识别和自然语言处理的专家。
贾里尼克1932年出生,他家是捷克的一个较富裕犹太家庭,本来可以有很好的教育。但是,这些都被二战打破了。父亲死在了集中营,而贾里尼克整天混迹于街头,战争结束后回到学校,很快赶上同班同学,但是也没有得过A。
1949年母亲带她移民到美国,很穷,他只有打工补贴家用,上学自然也被耽误。但是,他为的理想而努力的想法一直很坚定。最初,他想成为律师,为父亲一样的冤屈者辩护。但很快发现浓厚口语会让他在法庭上吃亏。
他又立志成为医生,但是被哈佛医学院高昂学费挡在门外,刚好麻省理工给他提供全额奖学金,他就开始了电气工程专业学习。在麻省理工,遇到了信息论鼻祖香浓博士,语言学大师贾格布森,这些大师对他影响很重要。
贾里尼克在麻省理工取得博士学位,在康奈尔任教,后去了IBM,在那里,建立了空前绝后强大的研究队伍,提出了统计语言识别的框架。他们的BCJR算法被IBM列为IBM有史以来对人类贡献的最大贡献之一。
贾里尼克曾经跟随信息论的创始人劳德·艾尔伍德·香农教授,深入地研究过数据通信的问题,是那个时代最好的通信专家。所以他在面对语音识别问题的时候,就自然而然地想到,语音识别其实可以类比成一个通信问题。
语音识别的本质,就是“说的人”要让“听的人”,明白自己的想法。这个过程可以分成三个步骤:
说话人把大脑里的想法组织成语言,通过语音表达出来;语音传递给收听的人,在收听人的大脑里从声音信号转变成神经信号;收听人把神经信号转换成说话人的想法。
这个过程,其实就相当于通信过程里的“编码-传输-解码”。所以,贾里尼克就想到了借用通信问题的解决思路,把语音识别不准的问题当成是通信过程里的噪音干扰问题,用大数据解决干扰的方法来解决语音识别的问题。