Hawk: 先进的ETL和爬虫流引擎

用 C#/WPF 编写的可视化爬虫和 ETL 集成开发环境。「visualized crawler & ETL IDE written with C#/WPF」

Github星跟蹤圖

Hawk: Advanced ETL & Crawler Stream Engine


Welcome to use Hawk! Hawk can graphically crawle webpage, clean, process and save data without programming, written in C#/WPF, open source according to the GPL protocol.

Introduction

The meaning of Hawk is "Eagle", which can kill prey efficiently and accurately. Its design idea comes from Lisp language , and its function mimics awk in Unix.

The key features are as follows:

  • Intelligent analysis of web content without programming.
  • WYSIWYG, conversion, filtering & storage with visually drag and drop.
  • Parallel processing & high speed
  • Support mutli-file & database: xml, csv, sqlite,mongodb...
  • Tasks can be save, pause, restart & reused.
  • Focus on crawler but power is far beyond that.

splash

Fast & Smart webpage crawling :

1.gif-1001.8kB

WYSIWYG ETL:

2.gif


欢迎使用Hawk! HAWK无需编程,可见即所得的图形化数据采集和清洗工具,依据GPL协议开源。

介绍

Hawk的含义为“鹰”,能够高效,准确地捕杀猎物。它的思想来源于Lisp语言,功能模仿了Linux工具awk。

特点如下:

  • 智能分析网页内容,无需编程
  • 所见即所得,可视化拖拽,快地实现转换和过滤等数据清洗操作
  • 能从各类数据库和文件实现导入导出
  • 任务可以被保存和复用
  • 其最适合的领域是爬虫和数据清洗,但其威力远超于此。

主要指標

概覽
名稱與所有者ferventdesert/Hawk
主編程語言C#
編程語言C# (語言數: 1)
平台
許可證Apache License 2.0
所有者活动
創建於2016-04-02 07:54:41
推送於2019-12-21 10:26:40
最后一次提交2019-12-21 16:25:29
發布數7
最新版本名稱v5.2 (發布於 )
第一版名稱2.0 (發布於 )
用户参与
星數3.2k
關注者數284
派生數1k
提交數286
已啟用問題?
問題數123
打開的問題數66
拉請求數4
打開的拉請求數1
關閉的拉請求數1
项目设置
已啟用Wiki?
已存檔?
是復刻?
已鎖定?
是鏡像?
是私有?