摘要:数据科学已融合多门学科于一体,包括数学,概率统计,机器学习自然语言处理,数据仓库,大数据,可视化,云计算等。

正因为多个学科的交叉和融合,给数据领域的从业者和学习者在使用和学习上带来的巨大的困难。

为了从互联网获取更多相关经验,收集整理了相关领域有一定价值的博客和站点。

数据挖掘

1、王路情–数据科学家

满满干货的大数据技术个人博客集合

涵盖的内容有,R语言,数据挖掘,机器学习等,大量的翻译和原创文章。

2、码农场

满满干货的大数据技术个人博客集合

大量关于NLP(自然语言处理)和机器学习的文章,作者开源了中文分词器HanNLP。

3、Licstar的博客

满满干货的大数据技术个人博客集合

如果要了解在中文上的数据挖掘的相关问题,可以阅读此博客。

4、我爱自然语言处理

满满干货的大数据技术个人博客集合

我爱自然语言处理的中文站点。同英文站点一样,文章优质,并且大多都是基于实践的内容。

5、我爱机器学习

满满干货的大数据技术个人博客集合

该站点同”52nlp”一样,不同的只是更加专注机器学习。

6、Spark MLlib 机器学习

满满干货的大数据技术个人博客集合

来自CSDN的一位博主,多是关于Spark Milb的文章。博主著有《Spark MLlib机器学习》一书,博客的文章同样质量很高。

7、alexminnaar

满满干货的大数据技术个人博客集合

来自国外的一个博客,丰富的机器学习实践经验,包括:神经网络,深度学习,线性回归等。

大数据

1、dongxicheng.org

满满干货的大数据技术个人博客集合

作者董西成,著有《Hadoop技 术内幕:深入解析MapReduce架构设计与实现原理》和《Hadoop技术内幕:深入解析YARN架构设计与实现原理》。

2、过往记忆

满满干货的大数据技术个人博客集合

国内比较出名的大数据个人博客,围绕Hadoop生态圈和Spark的大量文章可供阅读。

3、LXW的大数据田地

满满干货的大数据技术个人博客集合

比较偏重于Hadoop生态圈,文章的质量很高,能够解决一些实际生产中遇到的问题。

4、极豆技术博客

满满干货的大数据技术个人博客集合

个人博客,很多大数据和分布式的优质文章。

5、datalab

满满干货的大数据技术个人博客集合

比较综合的一个站点,很多大数据领域相关的文章,但偏重于资讯。

6、虾皮工作室

满满干货的大数据技术个人博客集合

来自博客园虾皮工作室,文章围绕Hadoop,适合入门学习。

7、粉丝日志

满满干货的大数据技术个人博客集合

早期学习Hadoop时,阅读了许多粉丝日志的文章,文章的质量很高,大都是解决一些实际问题。

8、数据分析网

满满干货的大数据技术个人博客集合

数据分析网,国内领先的大数据门户,旨在帮助大数据从业人士、爱好者提供大数据新闻资讯、前沿技术、业界观点的信息平台。

结语

数据科学领域的相关技术,近两年发展迅猛。有时仅凭个人的经验很难解决一些问题。互联网上遍布各类文章和资源,在学习时应该集万家之长,注重实践,并善于总结。同上面各博客的博主一样为知识的开源做一份贡献,让知识广为传播。

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。


本文由转载于互联网,如有侵权请联系删除!