我所尊重的许多数据分析师都使用版本控制。 例如:
但是,我正在评估采用诸如 git 之类的版本控制系统是否值得。
简要概述: 我是社会科学家,用 R 分析研究出版物的数据。 我目前不生产 R 包。 我的项目 R 代码通常包括几千行用于数据输入、清理、操作、分析和输出生成的代码。 发布通常使用 LaTeX 编写。
关于版本控制,我已经读到了很多好处,但是它们似乎与单独的数据分析师关系不大。
采用版本控制还有几个潜在的成本:
然而,我仍然觉得我错过了什么。 版本控制的一般指南似乎更多地针对计算机科学家,而不是数据分析人员。
因此,特别是在类似上述情况下的 与数据分析员有关: