怎么从word文件的二进制流中提取文本

举报 回答
怎么从word文件的二进制流中提取文本
问在线客服
扫码问在线客服

如题,请问如何实现?

  • 回答数

    5

  • 浏览数

    3,616

举报 回答

5个回答 默认排序
  • 默认排序
  • 按时间排序

没找到满意答案?去问秘塔AI搜索
取消 复制问题
已采纳
用BufferedReader挺容易搞定的。我之前写了一个小例子,分享出来大家参考下:

import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.Reader;
public class ReaderWordFile {
public static void main(String args) {
// 我这里假设word文件在F盘下的test.doc,所以先创建这个文件
File file = new File(F://test.doc);
FileInputStream fis = null;
Reader reader = null;
BufferedReader br = null;

try {
// 先搞个文件输入流,这是字节流,然后用Reader封装一下
// InputStreamReader就是连接字节流和字符流的桥梁,再用BufferedReader包装一下,就可以一行一行读了
fis = new FileInputStream(file);
reader = new InputStreamReader(fis);
br = new BufferedReader(reader);
String strLine;
StringBuffer sb = new StringBuffer();
// 用StringBuffer主要是为了高效拼接字符串,比直接用String快多了
while ((strLine = br.readLine()) != null) {
sb.append(strLine + n);
}

这代码看着是不是还挺清晰的?其实就是用BufferedReader一行一行读,然后用StringBuffer存起来。有兴趣的可以试试看,有问题欢迎一起讨论哈~
取消 评论
可以试试npoi这个东西,操作excel挺方便的,百度一下,有很多教程。
也可以用微软自带的office的dll试试看
取消 评论
如何将excel表里的数据提取到word文档里的解决方法如下:1、复制法。即将原来的数据直接复制后,在word中进行粘贴,这样数据就直接导入到word文档中了。
2、邮件合并法。在word中启用邮件合并,按向导的过程分别制作好需要插入的需要,数据源,对应关系,最后执行合并就可以了。
3、程序法。在word中插入合并域(如果是有规律的表格,可以不用这一步),然后编写vba程序,从excel文件中读取数据,然后写入到word中指定的位置。
上面三个方法中,方法1简单快捷,但是每次都需要操作,如果数据不是连续的块,需要复制粘贴多次,相对来说麻烦一点。方法2,一次设置可以多次使用,但不够灵活。方法3方便可以多次重复使用,但需要有一定的编程基础,可以根据工作的实际选择一个最适合的完成这个工作。
取消 评论
能够实现,比较麻烦,需要有一定的经验。大致分成3个步骤:
1.
提取图形字幕
安装VOBSUB的安装版,在我的115网盘可下。访问115网盘,选择提取文件,输入提取码f9df687e16,即可下载。
安装后,开始菜单—VOBSUB—VobSub
Configure
选取你存放DVD的目录(这个在从光盘上拷贝的时候要完全,也就是最好不要落下文件),之后点VobSub
Configure的打开,选择你的IFO文件,点确定即可。
这样生成了IDX+SUB的字幕。
2.
把图形字幕转换成文本字幕
按照步骤1提取的这种idx+sub字幕,是图形字幕。如果想修改其中的内容,需要用到字幕OCR软件,来把图形字幕转成文本字幕(一般用srt格式)。
如果要转换的是英文字幕,用subrip工具就可以实现idx+sub字幕识别成srt文本字幕。如果要转换的是中文字幕,先用subrip工具保存成bmp格式的图片,然后用subtosrt工具来识别成文字,保存成srt字幕格式。
3.
srt字幕转换为纯文本格式(去掉时间码)
可以用LRC歌词转换工具,把srt字幕转换成txt文本文件,去掉了时间码。得到文本文件之后,保存成word格式就很容易了。
取消 评论
ZOL问答 > 怎么从word文件的二进制流中提取文本

举报

感谢您为社区的和谐贡献力量请选择举报类型

举报成功

经过核实后将会做出处理
感谢您为社区和谐做出贡献

扫码参与新品0元试用
晒单、顶楼豪礼等你拿

扫一扫,关注我们
提示

确定要取消此次报名,退出该活动?

怎么从word文件的二进制流中提取文本