Fuel
Fuel 为您的机器学习模型提供了学习所需的数据。
- 与 MNIST、CIFAR-10(图像数据集)、Google 的十亿字(文本)等常见数据集的接口。
- 能够以各种方式对数据进行迭代,例如在迷你批次中使用洗牌/顺序实例。
- 预处理器的流水线,允许你对数据进行即时编辑,例如添加噪声、从句子中提取 n-grams、从图像中提取补丁等。
- 确保整个流水线是可以用 pickle 串行化的;这是能够检查点和恢复长期运行的实验的要求。为此,我们严重依赖 picklable_itertools 库。
Fuel 主要是为了 Blocks 的使用而开发的,Blocks 是一个帮助你训练神经网络的 Theano 工具包。
如果你有问题,不要犹豫,请写信到邮件列表。
引用 Fuel
如果您在工作中使用 Blocks 或 Fuel,我们将非常感谢您能引用以下论文:
Bart van Merriënboer, Dzmitry Bahdanau, Vincent Dumoulin, Dmitriy Serdyuk, David Warde-Farley, Jan Chorowski, and Yoshua Bengio, "Blocks and Fuel: Frameworks for deep learning," arXiv preprint arXiv:1506.00619 [cs.LG], 2015.
文档
更多信息请参见文档。