第94章(1 / 3)
李可唯俯下身,朝q版季想伸出了手,虚拟小人犹豫了一下,也朝他伸出了一只泛着荧光的手。
“他之所以能听懂我说话,是因为NLP(自然语言处理)先对我的话进行了一次语音识别,再将语音识别后生成的文本作为我们的输入词库。输入词库会结合语料库对文本进行情感分析,再逐级分解成对应的含义。”
“而我们的神经网络又会对这些含义进行一个二次处理,将AI的应答先转化为文本,再根据宿主的声音进行语音合成,此处特别鸣谢季想老师为我们提供了大量的真人语音资料。”
PPT翻至下一页,屏幕上出现了一堆花里胡哨的结构图,李可唯耐心地向观众解释道:“相比于‘掌中偶像’1.0的处理方式,我们在2.0中选择用CNN(卷积神经网络)来代替RNN(循环神经网络)对大量的语句进行处理。”
“有接触过深度学习的人应该知道,CNN多被广泛应用于计算机视觉的图像处理领域,而近年来,也有许多人将其运用到NLP中去。”
李可唯按下激光笔,屏幕上顿时出现了几个红红绿绿的表格,下方标了“像素”两个字。
“我们都知道,CNN是根据图像的像素值来进行处理的,而NLP处理的是文本和语句,那问题来了,怎么把这两个风马牛不相及的东西组合到一起呢?……”
季想坐在台下,目不转睛地望着台上演讲得愈发从容的李可唯。
尽管那人口中的专业术语他一个字也听不懂,但他喜欢那人认真的样子,喜欢那人沉浸在自己世界里的样子。
每当这时,李可唯的眼睛里都会带着一种光,炙热而夺目,令人一点也移不开视线。
“或许,我们可以把语句中的每一个单词划分开,分割成一个n维的向量,将形成的矩阵看成是一个特殊的图像,而每一个向量就相当于图像的像素,这样我们就可以对其进行处理了。”
屏幕一闪,出现了两个q版小人的测试模型,旁边的表格里展示了两个网络对自然语言处理的速度。
李可唯接着道:“大家可以看到,CNN的处理速度明显比RNN快,更换了神经网络之后,虚拟人像的接收延迟也从1.02s变成了0.34s。”
他点了点屏幕,画面变成了一个视频播放器:
“接下来让我们看一下动作捕捉的演示视频——”
↑返回顶部↑
“他之所以能听懂我说话,是因为NLP(自然语言处理)先对我的话进行了一次语音识别,再将语音识别后生成的文本作为我们的输入词库。输入词库会结合语料库对文本进行情感分析,再逐级分解成对应的含义。”
“而我们的神经网络又会对这些含义进行一个二次处理,将AI的应答先转化为文本,再根据宿主的声音进行语音合成,此处特别鸣谢季想老师为我们提供了大量的真人语音资料。”
PPT翻至下一页,屏幕上出现了一堆花里胡哨的结构图,李可唯耐心地向观众解释道:“相比于‘掌中偶像’1.0的处理方式,我们在2.0中选择用CNN(卷积神经网络)来代替RNN(循环神经网络)对大量的语句进行处理。”
“有接触过深度学习的人应该知道,CNN多被广泛应用于计算机视觉的图像处理领域,而近年来,也有许多人将其运用到NLP中去。”
李可唯按下激光笔,屏幕上顿时出现了几个红红绿绿的表格,下方标了“像素”两个字。
“我们都知道,CNN是根据图像的像素值来进行处理的,而NLP处理的是文本和语句,那问题来了,怎么把这两个风马牛不相及的东西组合到一起呢?……”
季想坐在台下,目不转睛地望着台上演讲得愈发从容的李可唯。
尽管那人口中的专业术语他一个字也听不懂,但他喜欢那人认真的样子,喜欢那人沉浸在自己世界里的样子。
每当这时,李可唯的眼睛里都会带着一种光,炙热而夺目,令人一点也移不开视线。
“或许,我们可以把语句中的每一个单词划分开,分割成一个n维的向量,将形成的矩阵看成是一个特殊的图像,而每一个向量就相当于图像的像素,这样我们就可以对其进行处理了。”
屏幕一闪,出现了两个q版小人的测试模型,旁边的表格里展示了两个网络对自然语言处理的速度。
李可唯接着道:“大家可以看到,CNN的处理速度明显比RNN快,更换了神经网络之后,虚拟人像的接收延迟也从1.02s变成了0.34s。”
他点了点屏幕,画面变成了一个视频播放器:
“接下来让我们看一下动作捕捉的演示视频——”
↑返回顶部↑