AVRO – 使用解析器进行反序列化

AVRO – 使用解析器进行反序列化


如前所述,可以通过生成与模式对应的类或使用解析器库将 Avro 模式读入程序。在 Avro 中,数据始终与其对应的架构一起存储。因此,我们始终可以在不生成代码的情况下读取序列化项。

本章介绍如何使用解析器库读取模式使用 Avro反序列化数据。

使用解析器库进行反序列化

序列化的数据存储在文件mydata.txt 中您可以使用 Avro 反序列化和读取它。

Avro 实用程序

按照下面给出的过程反序列化文件中的序列化数据。

步骤1

首先,从文件中读取模式。为此,请使用Schema.Parser类。此类提供了以不同格式解析模式的方法。

通过传递存储架构的文件路径来实例化Schema.Parser类。

Schema schema = new Schema.Parser().parse(new File("/path/to/emp.avsc"));

第2步

使用SpecificDatumReader创建DatumReader接口的对象

DatumReader<emp>empDatumReader = new SpecificDatumReader<emp>(emp.class);

第 3 步

实例化DataFileReader类。此类从文件中读取序列化数据。它需要DatumReader对象和序列化数据所在文件的路径,作为构造函数的参数。

DataFileReader<GenericRecord> dataFileReader = new DataFileReader<GenericRecord>(new File("/path/to/mydata.txt"), datumReader);

第四步

使用DataFileReader的方法打印反序列化的数据

  • hasNext()如果在读取器的任何元件方法返回一个布尔值。

  • DataFileReadernext()方法返回 Reader 中的数据。

while(dataFileReader.hasNext()){

   em=dataFileReader.next(em);
   System.out.println(em);
}

示例 – 使用解析器库进行反序列化

以下完整程序显示了如何使用 Parsers 库反序列化序列化数据 –

public class Deserialize {
   public static void main(String args[]) throws Exception{
	
      //Instantiating the Schema.Parser class.
      Schema schema = new Schema.Parser().parse(new File("/home/Hadoop/Avro/schema/emp.avsc"));
      DatumReader<GenericRecord> datumReader = new GenericDatumReader<GenericRecord>(schema);
      DataFileReader<GenericRecord> dataFileReader = new DataFileReader<GenericRecord>(new File("/home/Hadoop/Avro_Work/without_code_gen/mydata.txt"), datumReader);
      GenericRecord emp = null;
		
      while (dataFileReader.hasNext()) {
         emp = dataFileReader.next(emp);
         System.out.println(emp);
      }
      System.out.println("hello");
   }
}

浏览到放置生成代码的目录。在这种情况下,它位于home/Hadoop/Avro_work/without_code_gen

$ cd home/Hadoop/Avro_work/without_code_gen/

现在将上述程序复制并保存在名为DeSerialize.java的文件中编译并执行它,如下所示 –

$ javac Deserialize.java
$ java Deserialize

输出

{"name": "ramu", "id": 1, "salary": 30000, "age": 25, "address": "chennai"}
{"name": "rahman", "id": 2, "salary": 35000, "age": 30, "address": "Delhi"}

觉得文章有用?

点个广告表达一下你的爱意吧 !😁