我本人算是大数据的初学者,在学习大数据的过程中,经常遇到为什么用这个东西,为什么他能提高效率,为什么这个技术能更好的提高性能,这段代码会在哪些机子上执行这些问题。而搭建过程中也会遇到一些明明按照教程来的为什么就失败了。
我在学习过程中记录下这些细节,为了理清思路,让新手更容易学习和理解大数据,写了这个系列的文章。
- 1.流式数据库pipelinedb
- 2.分布式关系型数据库GreenPlum
扩展阅读-----MPP和Hadoop的定位以及分别适合的场景
- 1.Ignite
- 2 Ignite与Hadoop/Spark(还没写)
- 3.Redis
- 4.Mongodb
- 5.Cassandra