Quick-Start¶
安装引导¶
安装 DeepTables¶
pip install deeptables
GPU安装(可选): 如果你有gpu,并且想用它们加速训练,可以用下面命令安装:
pip install deeptables[gpu]
验证安装:
python -c "from deeptables.utils.quicktest import test; test()"
启动Notebook Docker容器¶
你可以通过Docker快速尝试DeepTables:
- 拉取一个DeepTables镜像。
- 启动容器。
拉取最新镜像:
docker pull datacanvas/deeptables-example
用这个命令启动Docker容器:
docker run -it -p 8830:8888 -e NotebookToken="your-token" datacanvas/deeptables-example
The value “your-token” is a user specified string for the notebook and can be empty.
notebook服务运行在https://host-ip-address:8830?token=your-token启动浏览器访问这个URL,你能看到Notebook的页面:
5行代码开启DT之旅¶
适用范围¶
DT能用来解决基于表格式数据的分类、回归预测问题。
简单例子¶
DT通过极其简单的接口支持这些任务,而不需要处理数据清理和特性工程。你甚至不指定任务类型,DT将自动推断。
from deeptables.models.deeptable import DeepTable, ModelConfig
from deeptables.models.deepnets import DeepFM
dt = DeepTable(ModelConfig(nets=DeepFM))
dt.fit(X, y)
preds = dt.predict(X_test)
数据集¶
DT有几个用于演示或测试的内置数据集,涵盖了二进制分类、多类分类和回归任务。所有数据集都是通过deeptables.datasets.dsutils访问的。
Adult¶
Associated Tasks: Binary Classification
根据人口普查数据预测收入是否超过5万美元/年,也被成为”Census Income”数据集。
from deeptables.datasets import dsutils
df = dsutils.load_adult()
Glass Identification¶
Associated Tasks: Multi-class Classification
来自美国法医科学服务局;6种玻璃; 根据氧化物含量定义(i.e. Na, Fe, K, etc)
from deeptables.datasets import dsutils
df = dsutils.load_glass_uci()
See: http://archive.ics.uci.edu/ml/datasets/Glass+Identification
Boston house-prices¶
Associated Tasks: Regression
from deeptables.datasets import dsutils
df = dsutils.load_boston()
See: https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_boston.html