sparser

Sparser: Raw Filtering for Faster Analytics over Raw Data

Github星跟踪图

sparser

This code base implements Sparser, raw filtering for faster analytics over raw data. Sparser can parse JSON, Avro, and Parquet data up to 22x faster than the state of the art. For more details, check out our paper published at VLDB 2018.

See the demo-repl directory for a brief example. To run it:

# update rapidjson submodule
git submodule init
git submodule update
cd demo-repl
make
./bench /path/to/large/file.json

Then enter 1 at the Sparser> prompt.

Sparser itself is just a header file and only depends on standard C libraries available
on most systems.

主要指标

概览
名称与所有者stanford-futuredata/sparser
主编程语言C
编程语言C++ (语言数: 3)
平台
许可证BSD 3-Clause "New" or "Revised" License
所有者活动
创建于2018-03-29 06:55:10
推送于2018-09-18 20:48:08
最后一次提交
发布数0
用户参与
星数433
关注者数38
派生数53
提交数285
已启用问题?
问题数5
打开的问题数5
拉请求数2
打开的拉请求数0
关闭的拉请求数1
项目设置
已启用Wiki?
已存档?
是复刻?
已锁定?
是镜像?
是私有?