Jina AI
🇩🇪Jina AI Ltd
Company info
Overview
专注于搜索AI基础模型(Embeddings、Reranker、Reader)的开源AI公司,为企业和开发者提供多模态、多语言的搜索解决方案
Industry tags
Key people
Core products and services
Jina Embeddings
多语言多模态文本向量化模型,支持最多8K token输入,用于语义搜索和RAG
Jina Reranker
多语言文档重排序模型,基于listwise架构提升检索相关性
Jina Reader
将URL转换为LLM友好的纯文本/Markdown格式,支持网页抓取和内容提取
Jina DeepSearch
深度搜索引擎,集成搜索、阅读和推理能力
Reader-LM
小型语言模型,将HTML转换为Markdown和JSON格式
Jina CLIP
多模态多语言向量模型,支持文本和图像的联合嵌入
Funding history
| Date | Round | Amount | Valuation | Investors | Confidence |
|---|---|---|---|---|---|
| 2020年02月 | Seed | $2M | — | GGV Capital, SAP.iO Lead | Medium confidence · 2 sources · Single authoritative source |
| 2020年09月 | Seed+ | ~$5.4M | — | GGV Capital, SAP.iO, Yunqi Partners Lead | Medium confidence · 2 sources · Single authoritative source |
| 2021年11月 | Series A | $30M | — | Canaan Partners Lead, Mango Capital, GGV Capital, SAP.iO, Yunqi Partners | High confidence · 3 sources · 2+ independent authoritative sources |
Product release timeline
第五代多语言嵌入模型,提供677M(small)和239M(nano)两个高效版本
jina-embeddings-v3正式上线Elastic Inference Service
2B参数小型多语言视觉语言模型,在多语言VQA上达到SOTA
基于Qwen3-0.6B的597M参数listwise重排器,支持131K上下文窗口
通用多模态多语言嵌入模型,支持文本与图像混合检索
小型语言模型,将HTML高效转换为Markdown和结构化JSON
多语言多模态嵌入模型,支持文本和图像的联合检索
570M参数多语言嵌入模型,支持32种语言、Task LoRA和Matryoshka维度
创新的上下文分块嵌入技术,利用长上下文模型保留文档级语义
首个支持8K token长文本的开源嵌入模型,性能对标OpenAI text-embedding-ada-002
Key events
Jina Embeddings v3正式集成至Elastic Inference Service,成为Elastic生态首个Jina模型
Elastic(NYSE: ESTC)完成对Jina AI的收购,肖涵博士加入Elastic担任VP of AI
被华尔街日报报道,作为欧洲科技AI领域代表公司
被Wired评为"2024年柏林最热门初创公司"之一
肖涵博士接受德国之声(DW)专访,讨论AI领域创业
完成$30M Series A融资,Canaan Partners领投
入选Forbes AI 30 DACH(德奥瑞地区AI 30强)
Jina AI在德国柏林成立,由肖涵博士创立
Competitive landscape
Voyage AI(已被MongoDB收购)
— 专注于高精度向量嵌入和重排序模型,提供领域特定模型(法律、金融、代码),voyage-multimodal-3.5支持文本/图像/视频多模态检索,在多个基准上超越Cohere Embed v4
Cohere(Embed v4)
— 提供大型语言模型和嵌入API的全栈NLP平台,Embed v4支持多模态(文本+图像)和内置int8/binary量化,覆盖100+语言
OpenAI(text-embedding-3)
— 行业标杆嵌入模型,text-embedding-3-large达3072维,生态系统完善但成本较高
BAAI / BGE
— 中国开源嵌入模型代表,在MTEB榜单上长期位居前列,完全免费开源
Hugging Face
— 全球最大AI模型托管平台,Jina AI的模型也通过HuggingFace分发,构成"竞合"关系
LangChain
— AI应用开发框架,在RAG流程编排层面与Jina的搜索工具链存在功能重叠
Elastic(收购方)
— 全球领先的搜索公司,通过收购Jina AI强化其向量搜索和AI搜索能力
搜索专精
Jina AI是少数专注于"搜索基础模型"(Search Foundation Models)的公司,产品线覆盖Embeddings→Reranker→Reader完整搜索流水线
开源策略
核心模型在HuggingFace开源(CC BY-NC 4.0),吸引开发者社区并建立生态
小而精团队
仅约30-50人团队即产出多个SOTA级搜索模型,研发效率极高
学术实力
团队在EMNLP、NeurIPS、ICLR、ACL等顶会持续发表论文,保持技术前沿
Task LoRA创新
通过LoRA适配器实现单一模型支持多种检索任务(查询匹配、分类、聚类等),降低部署成本
被收购后独立性丧失
2025年10月被Elastic收购后,Jina AI的产品战略将受Elastic整体方向约束,可能影响开源社区参与度
巨头竞争加剧
OpenAI、Google、Cohere等持续提升嵌入模型质量,嵌入模型正在商品化
收入规模有限
总融资仅$37.5-39M,被收购时团队约27-46人,暗示收入规模相对较小
Voyage AI被MongoDB收购
主要竞争对手Voyage AI被MongoDB战略收购,搜索基础模型赛道正快速整合
Growth metrics
Competitive narrative
Differentiators
Challenges and risks
Market position
Jina AI在搜索嵌入和重排序模型领域占据独特的细分市场地位。与OpenAI、Cohere等提供全栈AI解决方案的公司不同,Jina AI专注于搜索基础模型这一垂直领域,其模型在MTEB等行业基准上与规模远大于自身的竞争对手持平甚至领先。 被Elastic(市值约$88亿)收购是对Jina AI技术价值的重要认可。在嵌入模型赛道快速整合的背景下(Voyage AI→MongoDB、Jina AI→Elastic),独立嵌入模型公司正逐渐被大型搜索和数据基础设施公司吸纳,反映出这一技术已从独立产品转变为大平台的核心组件。