Tokenizers

为研究和生产而优化的快速先进的分词器。「💥 Fast State-of-the-Art Tokenizers optimized for Research and Production」

主要指标

概览

名称与所有者huggingface/tokenizers
主编程语言Rust
编程语言Rust (语言数: 8)
平台
许可证Apache License 2.0
发布数150
最新版本名称v0.22.1 (发布于 )
第一版名称v0.0.3 (发布于 )
创建于2019-11-01 17:52:20
推送于2025-09-19 09:46:10
最后一次提交
星数10112
关注者数124
派生数971
提交数1903
已启用问题?
问题数1096
打开的问题数85
拉请求数565
打开的拉请求数27
关闭的拉请求数168
已启用Wiki?
已存档?
是复刻?
已锁定?
是镜像?
是私有?
去到顶部