Quick-Start

安装引导

环境依赖

Python 3: DT 需要 Python 3.6 3.7。

Tensorflow >= 2.0.0: DT基于TensorFlow。

安装 DeepTables

pip install deeptables

GPU安装(可选): 如果你有gpu,并且想用它们加速训练,可以用下面命令安装:

pip install deeptables[gpu]

验证安装:

python -c "from deeptables.utils.quicktest import test; test()"

启动Notebook Docker容器

你可以通过Docker快速尝试DeepTables:

  1. 拉取一个DeepTables镜像。
  2. 启动容器。

拉取最新镜像:

docker pull datacanvas/deeptables-example

用这个命令启动Docker容器:

docker run -it -p 8830:8888 -e NotebookToken="your-token"  datacanvas/deeptables-example

The value “your-token” is a user specified string for the notebook and can be empty.

notebook服务运行在https://host-ip-address:8830?token=your-token启动浏览器访问这个URL,你能看到Notebook的页面:

5行代码开启DT之旅

适用范围

DT能用来解决基于表格式数据的分类、回归预测问题。

简单例子

DT通过极其简单的接口支持这些任务,而不需要处理数据清理和特性工程。你甚至不指定任务类型,DT将自动推断。

from deeptables.models.deeptable import DeepTable, ModelConfig
from deeptables.models.deepnets import DeepFM

dt = DeepTable(ModelConfig(nets=DeepFM))
dt.fit(X, y)
preds = dt.predict(X_test)

数据集

DT有几个用于演示或测试的内置数据集,涵盖了二进制分类、多类分类和回归任务。所有数据集都是通过deeptables.datasets.dsutils访问的。

Adult

Associated Tasks: Binary Classification

根据人口普查数据预测收入是否超过5万美元/年,也被成为”Census Income”数据集。

from deeptables.datasets import dsutils
df = dsutils.load_adult()

See: http://archive.ics.uci.edu/ml/datasets/Adult

Glass Identification

Associated Tasks: Multi-class Classification

来自美国法医科学服务局;6种玻璃; 根据氧化物含量定义(i.e. Na, Fe, K, etc)

from deeptables.datasets import dsutils
df = dsutils.load_glass_uci()

See: http://archive.ics.uci.edu/ml/datasets/Glass+Identification

Boston house-prices

Associated Tasks: Regression

from deeptables.datasets import dsutils
df = dsutils.load_boston()

See: https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_boston.html

Examples

See: Examples