Java 读取文件内容的六种方式
Java 读取文件内容的六种方式
1. Scanner
第一种方式是 Scanner,从 JDK1.5 开始提供的 API,特点是可以按行读取、按分割符去读取文件数据,既可以读取 String 类型,也可以读取 Int 类型、Long 类型等基础数据类型的数据。
@Test
void testReadFile1() throws IOException {
// 文件内容:Hello World|Hello Zimug
String fileName = "D:\\data\\test\\newFile4.txt";
try (Scanner sc = new Scanner(new FileReader(fileName))) {
while (sc.hasNextLine()) { // 按行读取字符串
String line = sc.nextLine();
System.out.println(line);
}
}
try (Scanner sc = new Scanner(new FileReader(fileName))) {
sc.useDelimiter("\\|"); // 分隔符
while (sc.hasNext()) { // 按分隔符读取字符串
String str = sc.next();
System.out.println(str);
}
}
//sc.hasNextInt()、hasNextFloat() 、基础数据类型等等等等。
// 文件内容:1|2
fileName = "D:\\data\\test\\newFile5.txt";
try (Scanner sc = new Scanner(new FileReader(fileName))) {
sc.useDelimiter("\\|"); // 分隔符
while (sc.hasNextInt()) { // 按分隔符读取 Int
int intValue = sc.nextInt();
System.out.println(intValue);
}
}
}
2. Files.lines (Java 8)
如果你是需要按行去处理数据文件的内容,这种方式是我推荐大家去使用的一种方式,代码简洁,使用 java 8 的 Stream 流将文件读取与文件处理有机融合。
@Test
void testReadFile2() throws IOException {
String fileName = "D:\\data\\test\\newFile.txt";
// 读取文件内容到 Stream 流中,按行读取
Stream<String> lines = Files.lines(Paths.get(fileName));
// 随机行顺序进行数据处理
lines.forEach(ele -> {System.out.println(ele);
});}
forEach 获取 Stream 流中的行数据不能保证顺序,但速度快。如果你想按顺序去处理文件中的行数据,可以使用 forEachOrdered,但处理效率会下降。
// 按文件行顺序进行处理
lines.forEachOrdered(System.out::println);
或者利用 CPU 多和的能力,进行数据的并行处理 parallel(),适合比较大的文件。
// 按文件行顺序进行处理
lines.parallel().forEachOrdered(System.out::println);
也可以把 Stream<String>
转换成 List<String>
, 但是要注意这意味着你要将所有的数据一次性加载到内存,要注意 java.lang.OutOfMemoryError
// 转换成 List<String>, 要注意 java.lang.OutOfMemoryError: Java heap space
List<String> collect = lines.collect(Collectors.toList());
3. Files.readAllLines
这种方法仍然是 java8 为我们提供的,如果我们不需要 Stream<String>
, 我们想直接按行读取文件获取到一个 List<String>
,就采用下面的方法。同样的问题:这意味着你要将所有的数据一次性加载到内存,要注意 java.lang.OutOfMemoryError
@Test
void testReadFile3() throws IOException {
String fileName = "D:\\data\\test\\newFile3.txt";
// 转换成 List<String>, 要注意 java.lang.OutOfMemoryError: Java heap space
List<String> lines = Files.readAllLines(Paths.get(fileName),
StandardCharsets.UTF_8);
lines.forEach(System.out::println);
}
4. Files.readString(JDK 11)
从 java11 开始,为我们提供了一次性读取一个文件的方法。文件不能超过 2G,同时要注意你的服务器及 JVM 内存。这种方法适合快速读取小文本文件。
@Test
void testReadFile4() throws IOException {
String fileName = "D:\\data\\test\\newFile3.txt";
// java 11 开始提供的方法,读取文件不能超过 2G,与你的内存息息相关
//String s = Files.readString(Paths.get(fileName));
}
5. Files.readAllBytes()
如果你没有 JDK11(readAllBytes() 始于 JDK7), 仍然想一次性的快速读取一个文件的内容转为 String,该怎么办?先将数据读取为二进制数组,然后转换成 String 内容。这种方法适合在没有 JDK11 的请开给你下,快速读取小文本文件。
@Test
void testReadFile5() throws IOException {
String fileName = "D:\\data\\test\\newFile3.txt";
// 如果是 JDK11 用上面的方法,如果不是用这个方法也很容易
byte[] bytes = Files.readAllBytes(Paths.get(fileName));
String content = new String(bytes, StandardCharsets.UTF_8);
System.out.println(content);
}
6. 经典管道流的方式
最后一种就是经典的管道流的方式
@Test
void testReadFile6() throws IOException {
String fileName = "D:\\data\\test\\newFile3.txt";
// 带缓冲的流读取,默认缓冲区 8k
try (BufferedReader br = new BufferedReader(new FileReader(fileName))){
String line;
while ((line = br.readLine()) != null){System.out.println(line);
}
}
//java 8 中这样写也可以
try (BufferedReader br = Files.newBufferedReader(Paths.get(fileName))){
String line;
while ((line = br.readLine()) != null) {System.out.println(line);
}
}
}
这种方式可以通过管道流嵌套的方式,组合使用,比较灵活。比如我们
想从文件中读取 java Object 就可以使用下面的代码,前提是文件中的数据是 ObjectOutputStream 写入的数据,才可以用 ObjectInputStream 来读取
try (FileInputStream fis = new FileInputStream(fileName);
ObjectInputStream ois = new ObjectInputStream(fis)){ois.readObject();
}