手写的输入法是怎样实现文字识别的啊

手写的输入法是怎样实现文字识别的啊,第1张

1,提取单字的特征,落笔顺序,笔画、形状、轮廓、偏旁等(软件早已完成)

2,建立手写模板库和单字特征数据库

3,对用户的字进行模板匹配,不能确定则给出类似字(后台进行)

4,用户选择后,利用单词库和语句库进行联想提示, 以增加用户输入速度

 1 cifar10数据库

60000张32*32 彩色图片 共10类

50000张训练

10000张测试

下载cifar10数据库

这是binary格式的,所以我们要把它转换成leveldb格式。

2 在../caffe-windows/examples/cifar10文件夹中有一个 convert_cifar_data.cpp

将他include到MainCaller.cpp中。如下:

编译....我是一次就通过了 ,在bin文件夹里出现convert_cifar_data.exe。然后 就可以进行格式转换。binary→leveldb

可以在bin文件夹下新建一个input文件夹。将cifar10.binary文件放在input文件夹中,这样转换时就不用写路径了。

cmd进入bin文件夹

执行后,在output文件夹下有cifar_train_leveldb和cifar_test_leveldb两个文件夹。里面是转化好的leveldb格式数据。

当然,也可以写一个bat文件处理,方便以后再次使用。

3 下面我们要求数据图像的均值

编译../../tools/comput_image_mean.cpp

编译成功后。接下来求mean

cmd进入bin。

执行后,在bin文件夹下出现一个mean.binaryproto文件,这就是所需的均值文件。

4 训练cifar网络

在.../examples/cifar10文件夹里已经有网络的配置文件,我们只需要将cifar_train_leveldb和cifar_test_leveldb两个文件夹还有mean.binaryproto文件拷到cifar0文件夹下。

修改cifar10_quick_train.prototxt中的source: "cifar-train-leveldb" mean_file: "mean.binaryproto" 和cifar10_quick_test.prototxt中的source: "cifar-test-leveldb"

mean_file: "mean.binaryproto"就可以了,

后面再训练就类似于MNIST的训练。写一个train_quick.bat,内容如下:

[plain] view plaincopy

copy ..\\..\\bin\\MainCaller.exe ..\\..\\bin\\train_net.exe

SET GLOG_logtostderr=1

"../../bin/train_net.exe" cifar10_quick_solver.prototxt

pause

我觉得捷速ocr文字识别软件,好一点,识别率比汉王等其他的要高一点, *** 作也是,而且可以识别英文。

使用方法:

第一步:打开下载好的软件,软件就自动进入到 *** 作主界面,界面非常的简洁,所有的 *** 作键都在软件的左上方。首先我们点击第一个“读取”按钮,找到需要识别的文件所在位置,点击即可完成文件的添加工作。

第二步:页面会出现原文件,这个时候我们点击“纸面解析”按钮,软件会对文件的段落等进行分析,这样识别得到的文件就会与原文件的段落排版一致。

第三步:一切准备就绪,点击“识别”按钮,单页的文件瞬间就能完成识别工作。页面的右边就会出现识别的结果,根据原文进行核对。

第四步:识别好的文件选择保存的格式,直接点击“word”或是“图片”即可。


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/sjk/9811518.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-02
下一篇2023-05-02

发表评论

登录后才能评论

评论列表(0条)

    保存