MongoDB的Python驱动PyMongo

创建连接

>>> import pymongo
>>> connection=pymongo.Connection('localhost',27017)
切换数据库

>>> db = connection.test_database
获取collection

>>> collection = db.test_collection
db和collection都是延时创建的,在添加Document时才真正创建

文档添加,_id自动创建

>>> import datetime
>>> post = {"author": "Mike",
... "text": "My first blog post!",
... "tags": ["mongodb", "Python", "pymongo"],
... "date": datetime.datetime.utcnow()}
>>> posts = db.posts
>>> posts.insert(post)
ObjectId('...')
批量插入

>>> new_posts = [{"author": "Mike",
... "text": "Another post!",
... "tags": ["bulk", "insert"],
... "date": datetime.datetime(2009, 11, 12, 11, 14)},
... {"author": "Eliot",
... "title": "MongoDB is fun",
... "text": "and pretty easy too!",
... "date": datetime.datetime(2009, 11, 10, 10, 45)}]
>>> posts.insert(new_posts)
[ObjectId('...'), ObjectId('...')]
获取所有collection(相当于SQL的show tables)

>>> db.collection_names()
[u'posts', u'system.indexes']
获取单个文档

>>> posts.find_one()
{u'date': datetime.datetime(...), u'text': u'My first blog post!', u'_id': ObjectId('...'), u'author': u'Mike', u'tags': [u'mongodb', u'python', u'pymongo']}
查询多个文档

>> for post in posts.find():
... post
...
{u'date': datetime.datetime(...), u'text': u'My first blog post!', u'_id': ObjectId('...'), u'author': u'Mike', u'tags': [u'mongodb', u'python', u'pymongo']}
{u'date': datetime.datetime(2009, 11, 12, 11, 14), u'text': u'Another post!', u'_id': ObjectId('...'), u'author': u'Mike', u'tags': [u'bulk', u'insert']}
{u'date': datetime.datetime(2009, 11, 10, 10, 45), u'text': u'and pretty easy too!', u'_id': ObjectId('...'), u'author': u'Eliot', u'title': u'MongoDB is fun'}
加条件的查询

>>> posts.find_one({"author": "Mike"})
高级查询

>>> posts.find({"date": {"$lt": d}}).sort("author")
统计数量

>>> posts.count()
3
加索引

>>> from pymongo import ASCENDING, DESCENDING
>>> posts.create_index([("date", DESCENDING), ("author", ASCENDING)])
u'date_-1_author_1'
查看查询语句的性能

>>> posts.find({"date": {"$lt": d}}).sort("author").explain()["cursor"]
u'BtreeCursor date_-1_author_1'
>>> posts.find({"date": {"$lt": d}}).sort("author").explain()["nscanned"]
2
附自己总结的一点小心得,仅供参考

缺点

不是全盘取代传统数据库(NoSQLFan:是否能取代需要看应用场景)不支持复杂事务(NoSQLFan:MongoDB只支持对单个文档的原子操作)文档中的整个树,不易搜索,4MB限制?(NoSQLFan:1.8版本已经修改为16M)
特点(NoSQLFan:作者在这里列举的很多只是一些表层的特点):

文档型数据库,表结构可以内嵌没有模式,避免空字段开销(Schema Free)分布式支持查询支持正则动态扩展架构32位的版本最多只能存储2.5GB的数据(NoSQLFan:最大文件尺寸为2G,生产环境推荐64位)
名词对应

一个数据项叫做 Document(NoSQLFan:对应MySQL中的单条记录)一个文档嵌入另一个文档(comment 嵌入 post)叫做 Embed储存一系列文档的地方叫做 Collections(NoSQLFan:对应MySQL中的表)表间关联,叫做 Reference

相关推荐