bitahub

Bitahub是一个拥有数百万张GPU卡、为用户提供Linux程序排队执行的集群计算系统，后端使用Docker做虚拟化，擅长机器学习算法训练。

BitaHub提供快速构建、训练模型的能力，让你专注于业务和科研，无需分心。

可以使用的计算资源类型：

卡类型	GPU	CPU核心数量	内存（GB）	价格（算力/小时）
GTX1080ti	用户选择，1~8，记其为X	X * 4	X * 16GB	X * 0.7
GTXTitanXp	用户选择，1~8，记其为X	X * 4	X * 16GB	X * 1
TeslaV100	用户选择，1~8，记其为X	X * 4	X * 40GB	X * 4.5
RTX3090	用户选择，1~8，记其为X	X * 6	X * 40GB	X * 2.5
无GPU	0	1	4G	0.2

说明：

（1）举例，申请2张RTX3090，将配套获得12个CPU计算核心和80GB的内存；

（2）1算力=1元；

（3）CPU的基本频率为2.30 GHz，最大睿频频率为3.20 GHz。

BitaHub帮助手册

https://www.bitahub.com/help/

在BitaHub进行算法训练，需要：

上传数据集（如果使用公开数据集，则跳过）；
上传模型（可选）；
创建项目，并选择数据集，上传代码文件；
运行任务，设置运行参数；
查看运行结果；

这里先解释以上四个步骤中涉及的概念，具体的操作演练，会在第一个项目这个小节演示。

1. 数据集

在BitaHub中我们提供了一些常用的科研数据集，可直接使用，我们称这部分数据集为公开数据集。

进入系统后，点击数据集可浏览。

系统同样支持用户维护私有数据集，在当前阶段，小于500M的数据集，可在平台直接点击上传数据集来操作；如果是大于500M的数据集，请联系管理员，使用ftp账户上传后再由管理员导入，管理员微信号：leinao1。

2. 模型

类似于数据集，BitaHub平台还有公开和私有的模型，进入系统后，点击模型可浏览公开模型。

同样地，小于500M的模型，可以在平台直接点击上传模型来操作；如果是大于500M的模型，请联系管理员，管理员微信号：leinao1。

模型与数据集的异同：从程序使用的角度，他们都是以文件夹进行组织的一系列文件；在存储配额上，模型则小得多，建议（但不是强制）只存放机器学习训练后保存的中间结果。

3. 项目

在BitaHub中，项目是一个虚拟单位，用于将算法代码、关联的数据集/模型、运行的软件环境和配置组织起来。

创建项目时，可以选择需要的数据集或模型，并将相关的代码文件上传到项目中。

4. 任务

项目的某次训练，我们称之为一次任务，一个项目可以包含多个任务。

任务的运行，需要配置运行参数，比如GPU类型、GPU个数、启动命令等。

任务提交后会进入等待状态，分配到资源后变为运行中，结束后变为成功或失败，过程中停止则变为停止。

5. 运行结果

某次任务运行过程中，系统会收集日志和任务输出，可以在任务详情页查看。

相关导航

Google Colab

Google Colab是谷歌开放的一款研究工具，主要用于机器学习的开发和研究，提供了免费的GPU使用！

矩池云

国内领先的主机(GPU)云共享平台,专注于人工智能领域的云服务商

通义千问

通义千问 - 7B（Qwen-7B）是阿里云研发的通义千问大模型系列的 70 亿参数规模的模型。Qwen-7B 基于 Transformer 在超大规模的预训练数据上进行训练得到。预训练数据类型多样，覆盖广泛，包括大量网络文本、专业书籍、代码等。同时，在 Qwen-7B 的基础上，使用对齐机制打造了基于大语言模型的 AI 助手 Qwen-7B-Chat