首页 排行 分类 完本 书单 专题 用户中心 原创专区
小说巴士 > 都市 > 重生学神有系统 > 第398章 商用级手写识别算法

重生学神有系统 第398章 商用级手写识别算法

作者:一碗酸梅汤 分类:都市 更新时间:2025-02-05 21:44:48 来源:小说旗

有图科技是一家股份制公司,专业生产各种扫描仪。

该公司出品的“宏图”系列光学扫描仪,在国内市场的占有率,一向超过60%。

之所以卖得这么好,跟他们自主研发的“宏图OCR”软件,关系不可谓不大。

软件研发部中,一场工作会议正在进行。

“王工,咱们的新版OCR,还得多久能投入市场?”

说话的是蓝战新,他今年不过40岁左右,却已在部长的位置上,稳坐了10余年。

王仁见部长点到自己,连忙回答说:“最多一个星期。”

蓝战新点了点头,看起来对这个答案比较满意。

他想了想,又问:“和上一版相比,性能提升的幅度多大?”

“3%以上。”王仁回答。

“这么高?”蓝部长有些意外。

王仁露出自信地微笑:“对比较干净的中文版面,理想情况下,识别正确率可超过92.8%,达到了国际先进水准。”

蓝战新眼神一亮:“太好了!这样一来,咱们的扫描仪产品,在国内的市场占有率,一定能进一步扩大。”

王工“谦逊”地一笑,摇了摇头:“不是我们厉害,是对手不够能打。”

蓝战新笑了起来:“这话有点道理。有句话怎么说来着,全靠同行衬托?”

其余人也陪着他一起笑了起来。

没错,一直以来,市场上的其他中文OCR产品,识别正确率基本在85%到90%之间波动。

宏图OCR已经是其中的佼佼者。

然而,他们万万料想不到,一个打破行业规则的强大OCR软件,即将出世……

※※※

虚拟空间里。

江寒花费了上百个小时,一共学完了三本书:《电动力学》、《量子力学I》、《热力学和统计物理》。

他的身边,也积攒了厚厚一摞空白图纸。

当然,现在这些图纸已经不空了,写满了各种算式和习题解答。

以江寒现在的学习速度,20~30小时一本书,一点压力也没有。

关键是,即使连续用脑上百小时,他仍然没有感到一丝倦意。

换成刚得到系统的时候,高强度学习、工作4~5个小时,也就差不多到极限了。

而自从学力等级提升到“学者9星”之后,他就没发现自己精力不够用过……

虽然消耗的冰岛红极参更多了,可是和带来的好处相比,那点金钱上的支出,完全是微不足道的。

江寒非常好奇,不知道自己现在,到底能连续学习多长时间?

于是接下来,他就毫不停顿地继续啃书、做习题。

又是上百个小时过去,《粒子物理与核物理导论》、《量子物理II》、《等离子体物理》也全学完了。

而他身边的空白图纸,也从10CM左右的高度,增长到了18CM以上。

江寒终于有了一丝倦意,但感觉还能撑住,于是毫不停留地继续学习。

《固体物理》、《高等光学》、《生物物理》、《流体力学》……

一个个txt文件学完,然后连同配套的小图片集,一起挪到了“已学”文件夹中。

不知过了多久。

江寒学完了最后一个txt文件后,愕然发现,“物理学”文件夹已经空了。

这意味着,他一晚之间,学完了大学物理学专业,本科阶段的大半专业课。

当然,只是理论方面,至于实验,还一个也没有做……

直到这时,江寒才感觉到了深深地疲倦,连忙退出了虚拟空间。

看了眼学科经验值面板。

物理学的进度条,只差不到15,就能升到高级了。

江寒忍不住咧嘴一笑。

这还不到三个小时,自己就搞定了十来本物理专业本科教材。

没啥意外的话,再有个把星期,物理、化学、生物三科,都能达到高级水准。

这种学习效率……

“嗯……搞不好,这才是虚拟空间的正确打开方式?”

江寒在心里嘟囔了一句,随后就昏睡了过去。

第二天醒来,他仍感觉精神不够饱满,注意力有点无法集中。

于是思考了一下后,起身、穿衣、下楼。

厨房里,夏如虹正忙着做早餐。

江寒笑着问候了一声“早安”,随后说:“阿姨,给我多加几个红极参吧。”

“没问题!”

夏如虹笑呵呵地答应了,一副心情不错的样子。

吃完饭,夏如虹出门上班,夏雨菲继续作曲。

江寒出门溜达了一圈,散心为主,顺便思考一下接下来的计划。

半小时后,他回到了别墅中,就打开笔记本电脑,开始开发新软件。

中文OCR都已经弄出来了,不妨稍微改进一下,再做一款性能过得去的“商用型中文手写识别”。

这个世界上以前并没有神经网络,但这并不意味着,就没有手写识别和语音识别了。

条条大路通罗马。

在机器学习领域,实现同样的功能,有许多方案可以选择。

只是这些替代方案,要么正确率不够高,要么需要强大的算力支持……

目前为止,在商业领域还没有足够高明的手写识别算法。

而这,正是江寒的机会。

老实讲,再过半个月,等他那两篇关于CNN的论文传播开来……

人工神经网络在图像识别领域的性能优势,一定会被有识之士注意到。

到时候,几乎可以肯定,会掀起一场技术更新的盛宴。

不出意外的话,各种各样使用了CNN的应用,会如雨后春笋般出现。

其中绝对少不了各种手写识别软件。

这样一来,要想在中文手写识别项目上赚到钱,就必须抓紧时间了……

用于中文手写识别的CNN网络,和OCR神经网络相比,在架构上极其相似。

江寒很快就把核心代码弄了出来,只在一些细节上,进行了微不足道的调整。

然而,最大的问题是缺少训练数据。

中文手写识别的素材库,基本上都攥在各大手机厂商,以及一些软件公司、研究所手里。

免费使用是根本不可能的,就算肯花钱,只怕那些厂商和行业大佬,也不会很容易松口。

江寒想了想,决定联系一下自己未来的导师。

张德昭人在科大,说不定能联络上讯飞公司。

手机里常见的讯飞输入法,就是讯飞公司研发的。

江寒手机里就有讯飞输入法,他重生之后,也试用过几次。

可惜的是,这时候的讯飞输入法,性能着实有点普通,语音输入还算可以,手写技术远远算不上成熟。

就算这样,讯飞输入法在国内外,已经算得上顶尖水准了。

事实上,在这个世界,大多数手写识别输入法,表现都很难让人满意。

不难猜想,很可能是缺少了人工神经网络技术,才导致了这种情况发生……

手写中文素材库这种东西,别的地方不好找,讯飞公司一定有。

而且这个时候的讯飞,还不是一家股份制公司。

这样更好,谈起交易来更加方便……

江寒拿出手机,给张德昭拨打了过去。

老张接起电话:“喂?”

江寒:“张教授,我是江寒。”

张德昭笑了起来:“是不是想好了,打算提前来上预科?”

江寒微微一笑:“那倒不是,我这次找您,是有别的事情。”

张德昭脾气很好:“只要不是你改主意不来了,那就有的商量。”

江寒呵呵一笑:“您老对我有点缺少信心了,说好的事情,哪那么容易变卦?”

老张松了口气:“那就好……什么事?说吧。”

江寒将自己的需求描述了一遍。

“手写汉字的素材?”

老张思考了一下,说:“据我所知,讯飞那边的确有一个素材库,规模好像还不小。”

顿了顿:“只是……”

江寒笑着问:“只是怎么?”

老张叹了口气:“我跟他们的朱总也不是很熟,空口白话的,很难让人家把那么重要的东西分享出来。”

江寒微微一笑:“我可不是冲着占便宜去的,该掏的钱还是会掏的……”

又说:“劳烦您从中撮合一下,不管是有偿使用,还是合作开发,我都可以考虑。”

老张考虑了一会儿,一咬牙:“行,我就豁出这张老脸,去当一回说客!”

江寒连忙感谢,想了想,又补充说:“当然,如果他们的条件太苛刻,那就算了,我也不想白忙活……”

张德昭哈哈一笑:“这个你就尽管放心吧,我一定尽量把条件谈得‘合理’一点。”

接下来,老张又询问了一下江寒的学习情况,这才是他最关心的事情。

江寒挑不那么耸人听闻的部分,简单地汇报了一下。

比如说,“粗略”地翻完了大学本科阶段,所有的信息学、数学,以及“少”部分物理学教材……

虽然江寒已经尽量轻描淡写了,但听在老张的耳朵里,仍稍嫌浮夸了一点。

“多学点数学和物理也是好事,但切记贪多嚼不烂,一定要保证学多少、会多少,在学好信息学的基础上,再兼顾其他科目……”

对于老张的殷殷叮嘱,江寒连声称是。

不过,回头该怎么学,还得怎么学。

自己的路,只能自己去走。

放下电话后,江寒继续完善程序。

本以为这事儿,即使老张亲自出马,一时半会儿的,只怕也谈不下来。

谁料,还没过两个小时,老张的电话就打了过来。

目录
设置
设置
阅读主题
字体风格
雅黑 宋体 楷书 卡通
字体风格
适中 偏大 超大
保存设置
恢复默认
手机
手机阅读
扫码获取链接,使用浏览器打开
书架同步,随时随地,手机阅读
收藏
换源
听书
听书
发声
男声 女生
语速
适中 超快
音量
适中
开始播放
推荐
反馈
章节报错
当前章节
报错内容
提交
加入收藏 < 上一章 章节列表 下一章 > 错误举报