sparser

Sparser: Raw Filtering for Faster Analytics over Raw Data

  • 所有者: stanford-futuredata/sparser
  • 平台:
  • 許可證: BSD 3-Clause "New" or "Revised" License
  • 分類:
  • 主題:
  • 喜歡:
    0
      比較:

Github星跟蹤圖

sparser

This code base implements Sparser, raw filtering for faster analytics over raw data. Sparser can parse JSON, Avro, and Parquet data up to 22x faster than the state of the art. For more details, check out our paper published at VLDB 2018.

See the demo-repl directory for a brief example. To run it:

# update rapidjson submodule
git submodule init
git submodule update
cd demo-repl
make
./bench /path/to/large/file.json

Then enter 1 at the Sparser> prompt.

Sparser itself is just a header file and only depends on standard C libraries available
on most systems.

主要指標

概覽
名稱與所有者stanford-futuredata/sparser
主編程語言C
編程語言C++ (語言數: 3)
平台
許可證BSD 3-Clause "New" or "Revised" License
所有者活动
創建於2018-03-28 22:55:10
推送於2018-09-18 12:48:08
最后一次提交
發布數0
用户参与
星數433
關注者數39
派生數54
提交數285
已啟用問題?
問題數5
打開的問題數5
拉請求數2
打開的拉請求數0
關閉的拉請求數1
项目设置
已啟用Wiki?
已存檔?
是復刻?
已鎖定?
是鏡像?
是私有?