VerticleSearchEngine

Academic Search Engine using Scrapy, MongoDB, Lucene/Solr, Tika, Struts2, Jquery, Bootstrap, D3, CAS

  • 所有者: pelick/VerticleSearchEngine
  • 平台:
  • 许可证:
  • 分类:
  • 主题:
  • 喜欢:
    0
      比较:

Github星跟踪图

VerticleSearchEngine

介绍

用'commits'记录毕设摸索的过程,“学术分享搜素引擎”
更多介绍参见 http://blog.csdn.net/zbf8441372/article/details/8697956 以及 http://blog.csdn.net/zbf8441372/article/details/8887188

相关工具

Scrapy: python爬虫

用于个性化定制网页爬取,以及通用性内容爬取
基于twisted异步网络框架,代码少,性能高

MongoDB:面向文档NoSQL

用于元数据存储,以及pdf文件存取
易用性最高的NoSQL,分布式,多分片,易扩展,我的场景下适合取代MySQL

Apache Lucene/Solr:索引建立/查询服务

为数据建立索引并定制隔离的搜索服务
最主流的搜索引擎搭建工具,互相兼容并提供常规搜索功能

Apache Tika:内容提取工具

用于提取pdf文本内容
兼容Lucene的多功能文本提取工具,适应很多类型文件,使用方便

CAS:开源单点登录解决方案

企业级SSO解决方案

其他:

Struts2 + Jquery + Bootstrap + D3

功能

基于爬取的学术资源,提供搜索、推荐、可视化、分享四块。

主要指标

概览
名称与所有者pelick/VerticleSearchEngine
主编程语言Java
编程语言JavaScript (语言数: 3)
平台
许可证
所有者活动
创建于2013-03-04 13:59:41
推送于2013-06-16 08:23:05
最后一次提交2013-06-16 16:22:48
发布数0
用户参与
星数99
关注者数21
派生数58
提交数81
已启用问题?
问题数2
打开的问题数2
拉请求数0
打开的拉请求数0
关闭的拉请求数0
项目设置
已启用Wiki?
已存档?
是复刻?
已锁定?
是镜像?
是私有?