Tokenizers

为研究和生产而优化的快速先进的分词器。「💥 Fast State-of-the-Art Tokenizers optimized for Research and Production」

主要指標

概覽

名稱與所有者huggingface/tokenizers
主編程語言Rust
編程語言Rust (語言數: 8)
平台
許可證Apache License 2.0
發布數142
最新版本名稱v0.21.1 (發布於 )
第一版名稱v0.0.3 (發布於 )
創建於2019-11-01 17:52:20
推送於2025-04-16 15:30:11
最后一次提交
星數9606
關注者數122
派生數883
提交數1860
已啟用問題?
問題數1046
打開的問題數68
拉請求數530
打開的拉請求數21
關閉的拉請求數153
已啟用Wiki?
已存檔?
是復刻?
已鎖定?
是鏡像?
是私有?
去到頂部