怎么从word文件的二进制流中提取文本
用BufferedReader挺容易搞定的。我之前写了一个小例子,分享出来大家参考下:import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.IOException;import java.io.InputStreamReader;import java.io.Reader;public class ReaderWordFile { public static void main(String args) { // 我这里假设word文件在F盘下的test.doc,所以先创建这个文件 File file = new File(F://test.doc); FileInputStream fis = null; Reader reader = null; BufferedReader br = null; try { // 先搞个文件输入流,这是字节流,然后用Reader封装一下 // InputStreamReader就是连接字节流和字符流的桥梁,再用BufferedReader包装一下,就可以一行一行读了 fis = new FileInputStream(file); reader = new InputStreamReader(fis); br = new BufferedReader(reader); String strLine; StringBuffer sb = new StringBuffer(); // 用StringBuffer主要是为了高效拼接字符串,比直接用String快多了 while ((strLine = br.readLine()) != null) { sb.append(strLine + n); }这代码看着是不是还挺清晰的?其实就是用BufferedReader一行一行读,然后用StringBuffer存起来。有兴趣的可以试试看,有问题欢迎一起讨论哈~