做这件事情不算太晚。
当然,曹阳也可以选择跟百度进行合作,就像前世金山做的那样。
不过考虑到自己有一个技术研究中心,搜索算法和云计算其实也是息息相关的部分,怎么能够进行分布计算,快速查询信息,这是云计算当中很重要的一个课题。
所以曹阳才决定让刘光然参与进来。
曹阳向他们解释了一番。
“屏幕取词翻译,需要用到两个技术,一个是图形当中的文字识别功能,”曹阳说,“这个课题也是我们最近正在研究的一部分,还有就是大数据搜索。
因为各国语言发展得相当的快,每年都会诞生许多网络用语,现在全球化的趋势越来越强,未来翻译软件的需求肯定很多。”
嗯……
刘光然低头思考着,果然曹老板做这个东西最终目的还是为了赚钱。
不过仔细想想曹阳说得也没有什么毛病,本来他们在做人工智能研究和大数据相关算法就跟这些是相关的,人工智能当中也有很重要的一项就是机器识别功能。
现在刘光然总算知道曹阳为什么要把小马哥叫过来了。
因为小马哥团队他们正在开发相关的技术,特别是图形识别,人脸识别和机器扫码相关的功能,都是微信和qq上面需要用到的。
至于提取和识别图形当中的文字,这一项工作qq部门其实已经研究了有一段时间了。
现在博米公司的主要网络安全部门就是放在深城的qq部门当中,因为之前qq盗号的现象比较严重,后来公司跟盗号者之间一直在进行防盗和破解的斗争,所以图形识别在保密系统上应用得更多一些。
由于有着丰富的斗争经验,博米公司的图形识别技术在全世界范围内都是领先的。
也多亏国内的盗号者们做出的杰出贡献,这就是中国的网络环境,不禁让曹阳感叹怪不得国内的软件技术这么牛批。
想想也觉得好笑,我们国家很多软件人才居然是在这样的艰苦斗争环境下成长起来的。
所以前世米国的系统被黑客入侵的时候,一般都会怀疑我们国家,或者是怀疑俄熊。
“只要能精确提取图片当中的文字进行识别,那么在线搜索和翻译应该不算难。”刘光然说。
屏幕取词翻译功能出来之后,至少可以帮助博米公司在各国的翻译小组减少他们手上的一大部分工作。
同时也能造福很多人,为旅行、跨国交流提供一些必要的工具。
最重要的,曹阳觉得这不单单是个赚钱的软件,还能磨炼自己团队的技术。
除此之外,曹阳还有一个更重要的考量,他将来有一款游戏产品可能会用到相关的翻译技术。
“还有同声翻译。”曹阳说,“既然做了在线翻译功能以及屏幕取词,那么我觉得就应该再深挖一步,当做博米翻译2.0版本。”
“哈?!”刘光然和小马哥记录到一半,感觉有些心累。
老板这个要求是不是有点过分了啊?
你机器都能实现语音翻译了,那么要翻译官来干嘛?
“这个技术有点难吧?”刘光然疑惑地说,“光是中国话,不同地区的方言都不一样,蜀普和滇普的差别都很大的啊。”
“先分两步走,”曹阳思考着说,“先做语音转文字,然后再做语音翻译功能。”
从原理上来说,其实并不算复杂,只要样本量足够大,就能进行精确匹配,这也是属于人工智能算法当中的一种。
还有就是引入人工智能系统之后,会根据使用者的一些使用习惯进行自我矫正。
就拿前世比较成熟的搜狗智能输入法来说,你一开始输入cy,可能会出来一大堆的词汇,比如说葱郁、产业、才有……
但是经过多次敲打【曹阳】这个名字之后,搜狗输入法就会根据你的使用习惯自动把曹阳组合成一个新的名词放到打字界面的最前页。
曹阳设想的语音识别和语音翻译功能也是基于类似的原理,首先通过使用者越多采集到的样本越多,建立一个庞大的网络数据库,然后在用户使用的过程当中通过大数据筛选进行精确匹配,比如四川话跟湖南话就会有差别,各个地方的方言虽然不太一样,可只要信息库够大,自然而然就能把你匹配到对应的语言体系当中。
“可以试试看,只不过需要多少时间还真的不好说。”刘光然思考着说。
“没事,早一点开发就早一点完工。”曹阳说。
这些其实都是在人工智能算法上进行的拓展内容了。
……
“同声翻译软件,想要做好肯定是需要一个长期过程的,”小马哥思考着说,“不过如果真的能做好,实现同声翻译的话,真的是一件非常好的事情,这个软件到时候肯定会有非常多的人使用的。”
翻译软件看似有点抢翻译的饭碗,实际上能带动不少旅游业和减少网络沟通成本,实现更紧密地全球化合作,让人与人之间的沟通更加顺畅。
虽然互联网连接了世界,被人们称为地球村,可实际上因为文化和语言的隔阂,导致大家的交流也很局限和区域化,可真的能有比较成熟的同声