重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
个人不认为nosql在少量数据存储上有啥优势。nosql主要解决的是auto sharding的问题,你不需要sharding,搞啥nosql. 作者:方圆 链接:
“专业、务实、高效、创新、把客户的事当成自己的事”是我们每一个人一直以来坚持追求的企业文化。 创新互联是您可以信赖的网站建设服务商、专业的互联网服务提供商! 专注于网站设计制作、网站建设、软件开发、设计服务业务。我们始终坚持以客户需求为导向,结合用户体验与视觉传达,提供有针对性的项目解决方案,提供专业性的建议,创新互联建站将不断地超越自我,追逐市场,引领市场!
你是想做数据分析对吧?
建议啊,先学R,R能应付很多统计问题了
再去学python,python语法当然了必须先掌握,这个很简单,然后就是python有两个
跟数据分析密切相关的包,如果你想做数据分析,请把重点放在两个包上
再学sql吧,毕竟单纯的学sql没有什么意义,因为什么也做不了
sql 建议先学sql server,有了python的语法基础学sqlserver很简单,当然没有基础也能学,只是有一门语言基础学起来更容易
学完sql server 再学oracle,oracle一定要学,其他数据库根据需求来学,比如Nosql就非常好
Apache三剑客:HBase, Cassandra, CouchDB。HBase的前景最为看好,因为它的开发者众多并且都是顶尖高手。Cassandra目前有很多否定的声音。CouchDB的小而精悍,赞誉很多,将要正式发布的CouchBase融合了MemBase和CouchDB,很令人期待。
HBase和Cassandra都是效仿Google的BigTable的基于列的数据库,它们都是用Java写的。另外一类似的数据库是HyperTable,百度用在一些后台分析,因为它是C++写的,速度比较快。不过HyperTable有点边缘,不太流行。这些基于列的开源数据库目前都比Goolge的BigTable差之少一个数量级
CouchDB是一个文档数据库。其最大的竞争者是MongoDB。MongoDB和HBase都采用主从服务器设计。CouchDB的服务器分布设计和Cassandra类似,Peer to Peer类型的。主从服务器设计一般能更好的strong consistent,属于CAP理论中的CP类型。 CouchDB和Cassandra一般认为都是eventual consistent,属于CAP理论中的AP类型。但其实MongoDB和Cassandra都可以设置成strong consistent或者eventual consistent。
以上所提到的数据库都支持MapReduce。好像出了HyperTable都支持非主键索引。HBase和strong consistent配置的MongoDB都支持最基本的锁定(HBase单行锁定,MongoDB单文档锁定),因此可以实现transaction,但是实现有点复杂和低效。单就transaction这一点,目前开源NoSQL数据库没有做的比较好的。
MongoDB的最大卖点是不需构建非主键索引也能执行很多查询。但是MongoDB的服务器分布设计实在不能让人恭维,可以说是NoSQL数据库中最Ugly的实现。
K-V数据库比较多,而且上面提到的基于列的数据库和文档数据库其实也都是K-V数据库。比较流行的纯种K-V数据库有:
Memcached: 非常流行,不支持持久化
VMWare's Redis: 很流行,新浪和知乎都在用,CP类型。
MemBase: 由很多Memcached的开发者开发,使用sqlite作底层存储。在社交游戏中用的比较多, zynga在用,CP类型。
Riak, 分布式实现和CouchDB/Cassandra比较像,AP类型。支持MapReduce。
Linkin's Voldemort, 在K-V中少见的eventual consistent ,AP类型。
TT, TC
纯基于二维座标索引的是Neo4j。但是现在MongoDB和CouchDB都集成这一特性。
目前CouchDB的开发者成立的公司CouchOne收购了MemBase,将其底层sqlite换成CouchDB推出了CouchBase,从而引入MapReduce以支持非主键索引。CouchBase暂时还没有正式发布官方正式版,不过快了。虽然CouchDB是eventual consistent的,但是CouchBase的开发者宣称CouchBase保持了MemBase的strong consistent特性,具体实现有待以后研究。
如果从成熟的角度来看,比较成熟并且十分流行的的有CouchDB,Memcached,Redis。
HBase和MongonDB和Cassandra都比较新,处于频繁更新之中。最有前途的是HBase,但是Hadoop/HBase集群的维护常常需要很多专业人员并且需要构建一个比较大的集群才能最大化体现出威力,因此用户主要是Facebook, yahoo, 百度和阿里巴巴等大公司。
个人比较期待CouchBase。
转载仅供参考,版权属于原作者。祝你愉快,满意请采纳哦
阿里云数据库团队比较熟,随手梳理了以下
丁奇:MySQL社区核心成员。专注于数据存储系统、MySQL 源码研究和改进、MySQL 性能优化和功能改进。
子嘉:Redis中国用户会发起人,Redis技术大学校长
叶翔:MongoDB江浙地区用户会主席
在此之前也是淘宝Tair分布式KV系统的技术负责人,负责过阿里云Memcache,Redis服务等,在阿里集团工作8年,一直在做NoSQL相关的技术。
德歌:阿里云 PostgreSQL技术负责人,PostgreSQL中国技术大学校长、GreenPlum源码深度研究者
彭立勋:参与了ACMUG(MySQL中国用户组)的发起和组建,担任副主席和杭州地区的组织者。MariaDB基金会唯一的中国成员
萧少聪:PostgreSQL 中国社区主席
如果每条记录的记录格式是固定的,不是不定列的,优先SQL,SQL体系发展了这么久,事件、索引等技术不是近年的NoSQL可比。
mongodb是基于文档式的,对于记录格式不等倒是不错,索引方面……还是不要提了。