huanghuang 初级会员 楼主 2007-05-22 16:27 私信 引用 编辑 PDF怎样完全转换为DOC文本呢? 急找了几个工具,转换不成功,很多字母转换不出来,变成_了[ 此贴被huanghuang在2007-05-24 12:37重新编辑 ] Approach.rar (68 K / 下载 0 次)
heroyb 风云元老 #1 2007-05-23 12:53 私信 引用 编辑 字母转换不出来很正常。pdf有多种制作方式,比如以latex类软件制作出的,为了美观,连写的ff都是特殊的(国外的科技文献很多都是这个样子),很多转换软件这部分转出来不是你想要的。有的则是标点符号不一样。不知道你的文件是什么样子的,中文的还是中英文的,图片的还是文字的。对于文字格式的内容,如果直接***出来不行的话,用那类软件转出来效果估计也差不多。这时就只能用ocr识别了。office本身的效果就相当不错。用法坛子里已经回复多次了