Bibliography Search MCP 让 AI 助手帮你搜论文的开源利器
项目已开源在 Tokisaki-Galaxy/bibliographySearchMCP,欢迎点 star。
背景
做学术研究时,文献检索是绕不开的第一步。但现实往往是:打开 Google Scholar 搜一个关键词,翻了几十页结果,却发现大部分要么不相关,要么是重复的。尤其是做中英文跨语言的课题时,还要在百度学术和英文数据库之间来回切换,效率极低。
Bibliography Search MCP 把这个问题解决得很优雅——直接让 AI 助手帮你搜论文。
它是什么
这是一个基于 MCP 协议的学术文献搜索服务,运行在 Cloudflare Workers 上。简单来说,你可以把它接入任何支持 MCP 的 AI 客户端(比如 Claude Desktop、Cursor 等),然后直接用自然语言让 AI 帮你搜索学术论文。
核心亮点
7 大学术数据库,一次搜索全覆盖
支持 arXiv、DBLP、Semantic Scholar、Crossref、OpenAlex、PubMed、百度学术共 7 个数据库。一次查询,结果自动去重、打分、排序,省去逐个平台对比的麻烦。
中英文自动识别
输入中文查询,系统自动识别并同时搜索百度学术和英文数据库,结果按 50/50 比例混合返回。输入英文则走英文数据库优先策略。不用手动切换语言,写什么就搜什么。
LLM 驱动的查询规划
这是最聪明的部分——通过 Groq API 调用大语言模型,将自然语言查询转换为精准的布尔搜索表达式。比如你输入”基于深度学习的医学影像诊断”,LLM 会自动生成类似 "deep learning" AND "medical image" AND "diagnosis" 的搜索语句,极大提升检索质量。
没有 Groq API key 也没关系,内置了中文学术词典作为降级方案,依然能用。但是针对中文搜索,效果远远不如有GroqAPI。
医学查询自动路由
当检测到生物医学相关关键词时,自动优先查询 PubMed,确保医学文献不遗漏。
智能打分排序
综合考虑标题相关性、来源权重、发表年份、引用次数等维度,对结果进行打分排序。arXiv 和 PubMed 的权重最高,最近 3 年的论文额外加分。
一键导出
搜索结果支持 CSV 和 BibTeX 两种格式导出。BibTeX 直接可以导入 LaTeX 写论文用,非常方便。
使用方式
1. 部署到 Cloudflare Workers(可选)
1 | |
2. 在 MCP 客户端配置
以 Claude Desktop 为例,在配置文件中添加:
1 | |
3. 直接用自然语言搜索
配置好后,直接在 AI 助手中说:
帮我搜一下关于 transformer 在时间序列预测方面的最新论文
AI 会自动调用 search_papers 工具,返回结构化的论文列表,包括标题、作者、年份、摘要、PDF 链接等。
不想部署?用 API Key 透传
如果不想部署,可以在 MCP 请求头中传递自己的 API key:
1 | |
技术亮点
- TypeScript + Cloudflare Workers:边缘计算,全球低延迟
- JSON-RPC 2.0:严格遵循 MCP 协议规范
- LLM 降级策略:Groq 不可用时自动降级到本地词典分析
- 渐进式搜索:先查权重高的数据库,不够再补,避免不必要的 API 调用
- 结构化输出:返回标准化的 Paper 对象,包含完整的元数据
适用场景
- 文献综述:快速了解某个领域的研究现状
- 选题调研:对比不同方向的研究热度
- 中英文跨语言检索:做中国特色课题时同时搜中英文文献
- 论文写作:导出 BibTeX 直接用在 LaTeX 中
- AI 辅助研究:让 AI 助手成为你的文献检索助手
总结
Bibliography Search MCP 把学术搜索和 AI 助手结合得很好。它不是简单的 API 封装,而是真正理解了学术搜索的痛点——语言自动识别、查询规划、多源融合、智能排序、一键导出,每一步都让搜索体验更流畅。
如果你经常需要做文献调研,或者想让 AI 助手帮你做学术研究,这个项目值得试试。