【教程】将Python转为C语言并编译生成二进制文件

转载请注明出处:小锋学长生活大爆炸[xfxuezhang.cn]

本教程以DGL版本的GCN为例,其他也相似。

1、安装cython、gcc:

sudo apt install cython  gcc -y

2、安装DGL、PyTorch:

pip3 install torch torchvision torchaudio
pip install dgl -f https://data.dgl.ai/wheels/cu117/repo.html
pip install dglgo -f https://data.dgl.ai/wheels-test/repo.html

3、编写gcn.py。注意添加# cython: language_level=3,不然默认用的是python2:

# cython: language_level=3

import torch
import torch.nn as nn
import torch.nn.functional as F
import dgl
from dgl.data import CoraGraphDataset
from dgl.nn import GraphConv

# 定义 GCN 模型
class GCN(nn.Module):
    def __init__(self, in_feats, h_feats, num_classes):
        super(GCN, self).__init__()
        self.conv1 = GraphConv(in_feats, h_feats)
        self.conv2 = GraphConv(h_feats, num_classes)

    def forward(self, g, in_feat):
        h = self.conv1(g, in_feat)
        h = F.relu(h)
        h = self.conv2(g, h)
        return h

if __name__ == "__main__":
    # 加载数据集
    dataset = CoraGraphDataset()
    g = dataset[0]

    # 创建模型实例
    model = GCN(g.ndata['feat'].shape[1], 16, dataset.num_classes)

    # 定义损失函数和优化器
    optimizer = torch.optim.Adam(model.parameters(), lr=0.01)
    criterion = nn.CrossEntropyLoss()

    # 训练模型
    for epoch in range(200):
        logits = model(g, g.ndata['feat'])
        loss = criterion(logits[g.ndata['train_mask']], g.ndata['label'][g.ndata['train_mask']])
        
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        if epoch % 10 == 0:
            print(f'Epoch {epoch}, Loss: {loss.item()}')

    # 测试模型
    model.eval()
    with torch.no_grad():
        logits = model(g, g.ndata['feat'])
        _, predicted = torch.max(logits[g.ndata['test_mask']], 1)
        correct = (predicted == g.ndata['label'][g.ndata['test_mask']]).sum().item()
        acc = correct / len(predicted)
        print(f'Accuracy: {acc:.4f}')

4、使用cython将Python转为C语言,此时会生成一个gcn.c文件。注意要加--embed

cython gcn.py --embed

5、然后使用 C 编译器来编译gcn.c文件,此时会生成一个gcn.o文件:

gcc -c gcn.c `python3-config --includes` `python3-config --ldflags` -o gcn.o

6、链接生成可执行文件,此时会生成一个gcn可执行文件。注意这里-L后面改成你的路径:

gcc gcn.o -L/home/sxf/anaconda3/envs/dgl/lib  -lpython3.9 -o gcn

7、运行二进制可执行文件:

./gcn

8、如果报错:error while loading shared libraries: libpython3.9.so.1.0: cannot open shared object file: No such file or directory。就把这个so文件的路径包含进来,再重新执行步骤7。注意这里后面改成你的路径:

export LD_LIBRARY_PATH=/home/sxf/anaconda3/envs/dgl/lib/:$LD_LIBRARY_PATH 

9、最终效果:

注意:

1、如果你有多个自定义的py文件要import进来,那么自定义的几个py文件需要转为so库文件,来被主文件调用。而如果只有一个py文件,就没有这个问题了。

2、有些安装的库也要编译为so文件,比如dgl,不然运行二进制文件会报错No module。通过编译源码,可以在build目录下得到libdgl.so,链接时候还要-L加入这个so的路径。我直接把这两个so复制过来,那么链接命令就简化成了(以此类推):

gcc gcn.o -L. -lpython3.9 -ldgl -o gcn

或者直接pip安装这个库也行,就可以不用生成libdgl.so了:

pip install dgl