189 8069 5689

大数据中如何管理我们的建模项目文件

这篇文章将为大家详细讲解有关大数据中如何管理我们的建模项目文件,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

创新互联主要从事网站制作、做网站、网页设计、企业做网站、公司建网站等业务。立足成都服务南岸,十载网站建设经验,价格优惠、服务专业,欢迎来电咨询建站服务:13518219792

大家可以先看看这张图,这个我们在做建模项目时,个人比较推荐的一个建项目文件的demo。

大数据中如何管理我们的建模项目文件    

这个项目文件结构是我平时经常用的,会根据项目复杂度自行删减一些内容,不过总体的框架还是差不多的,所以分享给大家参考下呗,因为个人用起来还是蛮不错的,图片里讲了还是比较详细的了,不过我还是挑一些重点来简单解释一下:

experiment:专门用来存放我们的实验文件,也就是那些不断地测试算法的中间文件。
model:存放不同算法的最终版本代码的文件夹
data:存放数据的文件夹,里面还会分不同类别去存放数据,比如external(来自第三方的数据)、interim(经过部分清洗转换的数据源,如SQL、SAS)、raw(原始数据集,不添加任何加工)、processed(最终用于建模的数据集)、code(用于储存数据清洗的代码)

关于大数据中如何管理我们的建模项目文件就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。


本文名称:大数据中如何管理我们的建模项目文件
文章来源:http://cdxtjz.com/article/ihgshe.html

其他资讯