# [方案]造一个gpt

Andrej Karpathy 大神

构建 GPT-2 网络,然后优化对应训练速度
并按照 GPT-2 和 GPT-3 论文参数设置训练运行


# 参考 @ref