第一十三章-十六岁的花季(1/3)
第七十九章
“现场演示?”周青山哈哈大笑起来,撇撇嘴说道:“就算我是中⛌文系的,也知道一款输入法软件的开发周期需要很久。你们公司成立多长时间了?有一个🟌🛱☧月吗?侯世达你当自己是yy小说主角了吧?一晚上就能写出个世界第🌌♐一的浏览器程序来,哈哈哈哈!”
侯世达淡淡的看了他一眼,心里其实很奇怪。按说帝邮在国内也算排的上号的好大学了,能考上的不可能智商欠费,但怎么学生会里扎堆的都是这么一类人呢?事儿妈、小心眼、没有自知之明,表面上看好像会做人,其实反而让人打心眼里讨厌。
这周青山🗹按说造型不差,🇧🚾放电视剧里起码都能活十分钟。怎么一张嘴,就让人有种他欠揍的冲🚱🗇🙡动……
“哦,周会长还知道自己是中文系的啊?”侯世达呵呵轻笑,摇头道:“那就请你闭嘴🗚🜉,我们软件专业的问题,你算老几?😗🁢”
“你……”
周青山何曾被人这么抢白过,当真是差点没被气的翻白眼来。不过看周围同学们的眼神,也都是差🛴☻不多一样的轻视。
侯世达失望的摇头道:“你什么?以你的智商,我很🗺难和你解释🖵🗁什么叫做测试版的。”
“哈哈哈哈——”
周围传来一阵笑声,众人心中也觉得周青山🎋🏣和侯世达这次交锋真🖵🗁是找虐,他一个文科生和人家专业程序🁜🆤👠员起腻,真不知道脑袋怎么想的。
周青山被气的脸色一阵发白,恨恨的点♳头道:“好,那我就看你怎么把牛皮吹破。”
侯世达转过身来,不再把注意力放在他的身上,而是走到了木架🖵🗁旁边。他掀开木架上的第一页纸,第二页纸上面画了一个树状图,就听他说道。
“在展示我们的内部开发测试版之前,我先简要的说一🕀下♙🈷六耳输入法的实现原理🞼🙠吧。”
“这是一幅我们人类负责语言思维的决策树状图,我认为人类的语言并非只是一种信息传递协议,更是认知世界的重要工具。输入法若想理解人类的‘语法’,首先得了解人类思考🉂的两大部分——知识和智能。可以说人类所谓的智慧,就是由这两部分构成的。而一直以来的输入法,对数据的处理方式,都是用计算机理解的二维表格数据库模式。正是这种和人类思维完全不同的数据处理方式,导致了现在的数据爆炸问题。”
……
侯世达不断的将木架上🏲🞁👊的白纸掀开,从人类思🝱维的模式开始侃侃而谈。
别看未来所谓的智能输入法好🃈🕸🎖像遍地开花,于是就觉得这东西非常简单。恰恰相反,识别率越高的输入法对技术要求就越高。尤其是侯世达对六耳输入法并不满足于实现整句输入为止,而是必须在整句输入的前提下能够实现至少95%的首次输入正确率。
如果只是打出拼音来,然后判断每个词的组成,最后用几个词语组成一句不通的句子,那用微软的智能abc就能做到,用户不🏽🟡🞫过多敲打几下空格而已。但要做到整句输入,就是要让用户一次输入整个句子,一气呵成。让后面的词语能够根据前面的内容、语义进行自动关联,这种对数据的要求,是传统表型数据无法提供的。
人类对语言的处理过程,不是二维结构,而是一种空间坐标形式存在🙷🎽的。要想让计算机实现人类的“联想”能力,就要让数据像人类处理知识一样,具有进行空间排列。若想能够对数据进行分析、归类和查🎩📳找,就要知道人类的脑海中知识是如何存在的?归根结底,是一个个神经元中的电脉冲。而神经元肯定不是二维结构,而是所有脑细胞组成的三维结构。
一个神经元被激活之后,会向它附近所有的神经元发🗺射🕀一束电脉冲。一个神经元发射的电脉冲不足以激活🁞另一个神经元,但如果一个神经元在一个单位时间内有多个电脉冲抵达,那就会被激活,这就是人类思考的过程。
智能输入法中用户输入的每一个词,都会向后面的其他词语添加一个阈值。当后🞼🙠面某个词的阈值突破临界点之后,就可以进入备选的范围之内。而这个备选数据库,就是解决信息爆炸问题的关键。因为它是一个三维矩阵形式的数据库,通过knn近邻算法,就能实现非常高的选🞤择准确率。
尤其是通过这种算法,还能对词库里🜬没有出现过⛧的新词,经过几次训练之后就实现机器学💋习。这一点对无法穷尽人类词语的词库来说,意义特别重大。
“现场演示?”周青山哈哈大笑起来,撇撇嘴说道:“就算我是中⛌文系的,也知道一款输入法软件的开发周期需要很久。你们公司成立多长时间了?有一个🟌🛱☧月吗?侯世达你当自己是yy小说主角了吧?一晚上就能写出个世界第🌌♐一的浏览器程序来,哈哈哈哈!”
侯世达淡淡的看了他一眼,心里其实很奇怪。按说帝邮在国内也算排的上号的好大学了,能考上的不可能智商欠费,但怎么学生会里扎堆的都是这么一类人呢?事儿妈、小心眼、没有自知之明,表面上看好像会做人,其实反而让人打心眼里讨厌。
这周青山🗹按说造型不差,🇧🚾放电视剧里起码都能活十分钟。怎么一张嘴,就让人有种他欠揍的冲🚱🗇🙡动……
“哦,周会长还知道自己是中文系的啊?”侯世达呵呵轻笑,摇头道:“那就请你闭嘴🗚🜉,我们软件专业的问题,你算老几?😗🁢”
“你……”
周青山何曾被人这么抢白过,当真是差点没被气的翻白眼来。不过看周围同学们的眼神,也都是差🛴☻不多一样的轻视。
侯世达失望的摇头道:“你什么?以你的智商,我很🗺难和你解释🖵🗁什么叫做测试版的。”
“哈哈哈哈——”
周围传来一阵笑声,众人心中也觉得周青山🎋🏣和侯世达这次交锋真🖵🗁是找虐,他一个文科生和人家专业程序🁜🆤👠员起腻,真不知道脑袋怎么想的。
周青山被气的脸色一阵发白,恨恨的点♳头道:“好,那我就看你怎么把牛皮吹破。”
侯世达转过身来,不再把注意力放在他的身上,而是走到了木架🖵🗁旁边。他掀开木架上的第一页纸,第二页纸上面画了一个树状图,就听他说道。
“在展示我们的内部开发测试版之前,我先简要的说一🕀下♙🈷六耳输入法的实现原理🞼🙠吧。”
“这是一幅我们人类负责语言思维的决策树状图,我认为人类的语言并非只是一种信息传递协议,更是认知世界的重要工具。输入法若想理解人类的‘语法’,首先得了解人类思考🉂的两大部分——知识和智能。可以说人类所谓的智慧,就是由这两部分构成的。而一直以来的输入法,对数据的处理方式,都是用计算机理解的二维表格数据库模式。正是这种和人类思维完全不同的数据处理方式,导致了现在的数据爆炸问题。”
……
侯世达不断的将木架上🏲🞁👊的白纸掀开,从人类思🝱维的模式开始侃侃而谈。
别看未来所谓的智能输入法好🃈🕸🎖像遍地开花,于是就觉得这东西非常简单。恰恰相反,识别率越高的输入法对技术要求就越高。尤其是侯世达对六耳输入法并不满足于实现整句输入为止,而是必须在整句输入的前提下能够实现至少95%的首次输入正确率。
如果只是打出拼音来,然后判断每个词的组成,最后用几个词语组成一句不通的句子,那用微软的智能abc就能做到,用户不🏽🟡🞫过多敲打几下空格而已。但要做到整句输入,就是要让用户一次输入整个句子,一气呵成。让后面的词语能够根据前面的内容、语义进行自动关联,这种对数据的要求,是传统表型数据无法提供的。
人类对语言的处理过程,不是二维结构,而是一种空间坐标形式存在🙷🎽的。要想让计算机实现人类的“联想”能力,就要让数据像人类处理知识一样,具有进行空间排列。若想能够对数据进行分析、归类和查🎩📳找,就要知道人类的脑海中知识是如何存在的?归根结底,是一个个神经元中的电脉冲。而神经元肯定不是二维结构,而是所有脑细胞组成的三维结构。
一个神经元被激活之后,会向它附近所有的神经元发🗺射🕀一束电脉冲。一个神经元发射的电脉冲不足以激活🁞另一个神经元,但如果一个神经元在一个单位时间内有多个电脉冲抵达,那就会被激活,这就是人类思考的过程。
智能输入法中用户输入的每一个词,都会向后面的其他词语添加一个阈值。当后🞼🙠面某个词的阈值突破临界点之后,就可以进入备选的范围之内。而这个备选数据库,就是解决信息爆炸问题的关键。因为它是一个三维矩阵形式的数据库,通过knn近邻算法,就能实现非常高的选🞤择准确率。
尤其是通过这种算法,还能对词库里🜬没有出现过⛧的新词,经过几次训练之后就实现机器学💋习。这一点对无法穷尽人类词语的词库来说,意义特别重大。