...
首页> 外文期刊>電子情報通信学会論文誌, D. 情報·システム >重複部分木情報を利用した事前圧縮を特徴とするSerDeの開発と評価
【24h】

重複部分木情報を利用した事前圧縮を特徴とするSerDeの開発と評価

机译:使用重叠子树信息进行预压缩的SerDe的开发和评估

获取原文
获取原文并翻译 | 示例
           

摘要

ビッグデータを扱うシステムでは,ストレージ資源の節約や1/0負荷の低減のために,Serializer/Deserializer (以下,"SerDe")が利用される.従来のSerDeは,木構造データをバイト配列へ直列化し, 更に既存圧縮技術を適用してデータサイズを縮小する.しかし既存圧縮技術では,大きな部分木単位で重複があ る場合や重複した部分木どうしが離れている場合に,その冗長性を十分に利用した圧縮を行えない.そこで我々 は,部分木どうしの等値性や重複した部分木の出現回数などの情報を利用した事前圧縮を行うSerDeを開発し た.重複した部分木を含む木構造データを扱う場合,従来のSerDeと既存圧縮技術の組合せよりも性能上の優位 性を示すことを,その評価結果とともに述べる.
机译:在处理大数据的系统中,Serializer / Deserializer(以下称为“ SerDe”)用于节省存储资源并减少1/0的负载;传统的SerDe将树结构数据序列化为字节数组。但是,当大型子树单元中存在重复项或重叠的子树相互分离时,现有的压缩技术会提供足够的冗余。因此,我们开发了SerDe,它使用子树的等效性和重复的子树的出现次数等信息执行预压缩,这些树包含重复的子树。描述了在处理结构数据时,与常规SerDe和现有压缩技术相结合,与评估结果相比,它显示出性能优势。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号