google/embeddinggemma-300m

Primitive: /encode · Encode · Gemma 3

Model Page: EmbeddingGemma

Dense

Overview

Hardware: — drives latency, throughput & cost

Size	303M params
Tasks	/encode
License	gemma
Latency	87 ms
Throughput	27.2K tok/s
Cost	$0.0082 /1M tok

Cost is approximate — computed from list GPU prices; your actual price depends on the provider you deploy SIE with.

Embedding

Output types	Dense
Dimensions	dense: 768
Max sequence length	2,048
Inputs	text

Benchmarks

CQADupstackPhysicsRetrieval

scientific retrieval en

Duplicate question retrieval from StackExchange Physics

Corpus: 38,314 Queries: 1,039

Quality

ndcg at 10 0.4733

map at 10 0.4090

mrr at 10 0.4670

Reference →

CosQA

technology retrieval en

Code search with natural language queries

Corpus: 6,267 Queries: 500

Quality

ndcg at 10 0.3981

map at 10 0.3067

mrr at 10 0.3095

Reference →

FiQA2018

finance retrieval en

Financial opinion mining and question answering

Corpus: 57,599 Queries: 648

Quality

ndcg at 10 0.2649

map at 10 0.2011

mrr at 10 0.3240

Reference →

LegalBenchConsumerContractsQA

legal retrieval en

Question answering on consumer contracts

Corpus: 153 Queries: 396

Quality

ndcg at 10 0.8032

map at 10 0.7513

mrr at 10 0.7500

Reference →

NFCorpus

medical retrieval en

Biomedical literature search from NutritionFacts.org

Corpus: 3,593 Queries: 323

Quality

ndcg at 10 0.2619

map at 10 0.0815

mrr at 10 0.4417

Performance L4 b1 c16

Corpus 27.2K tok/s

Corpus p50 86.8ms

Query 540 tok/s

Query p50 82.0ms

Performance RTX-4090 b1 c16

Corpus 79.6K tok/s

Corpus p50 55.7ms

Query 1.9K tok/s

Query p50 27.8ms

Reference →

SCIDOCS

scientific retrieval en

Citation prediction, document classification, and recommendation for scientific papers

Corpus: 25,656 Queries: 1,000

Quality

ndcg at 10 0.1092

map at 10 0.0598

mrr at 10 0.1956

Reference →

SciFact

scientific retrieval en

Scientific claim verification using research literature

Corpus: 5,183 Queries: 300

Quality

ndcg at 10 0.7054

map at 10 0.6565

mrr at 10 0.6670

Reference →

StackOverflowQA

technology retrieval en

Programming question answering from Stack Overflow

Corpus: 19,931 Queries: 1,994

Quality

ndcg at 10 0.6961

map at 10 0.6744

mrr at 10 0.6744

Reference →

google/embeddinggemma-300m

Overview

Embedding

Benchmarks

CQADupstackPhysicsRetrieval

CosQA

FiQA2018

LegalBenchConsumerContractsQA

NFCorpus

SCIDOCS

SciFact

StackOverflowQA

Open source inference for agents