如何往mongodb存python set

如何往mongodb存python set,第1张

下载python中MongoDB的驱动程序

pip install pymongo

然后确保MongoDB已经安装且可以正常运行,去官网下载相应版本:https://www.mongodb.com/

mkdir -p /home/tools

cd/home/tools

wget https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-3.4.2.tgz

解压文件并修改目录名

tar -zxvf mongodb-linux-x86_64-3.4.2.tgz

mv mongodb-linux-x86_64-3.4.2 mongodb3.4.2

ln -s mongodb_3.4.2 mongodb

MongoDB 的可执行文件位于 bin 目录下,所以可以将其添加到 PATH 路径中

export PATH=/home/tools/mongodb/bin:$PATH

MongoDB的数据存储在data目录的db目录下,但是这个目录在安装过程不会自动创建,所以你需要手动创建data目录,并在data目录中创建db目录。

mkdir -p /data/db

在mongo安装目录中的bin目录执行mongod命令来启动mongdb服务

./mongod --dbpath /data/db

如果想进入MongoDB后台管理

./mongo

# ./mongoMongoDB shell version v3.4.2connecting to: mongodb://127.0.0.1:27017MongoDB server version: 3.4.2Welcome to the MongoDB shell......................

times number of files.2017-03-12T01:15:04.901+0800 I CONTROL  [initandlisten]

>

使用用户 admin 使用密码 123456 连接到本地的 MongoDB 服务上

>mongodb://admin:123456@localhost/...

创建数据库(如果数据库不存在,则创建数据库,否则切换到指定数据库)

... use test2017-03-12T01:34:04.361+0800 E QUERY    [thread1] SyntaxError: missing before statement @(shell):3:4

>use test

switched to db test>db

test>show dbs    #查看所有数据库admin  0.000GB

local  0.000GB

python *** 作mongodb

连接mongodb

#!/usr/bin/env python# -*- coding:utf-8 -*-from pymongo import MongoClient

conn = MongoClient('192.168.0.113', 27017)

db = conn.mydb  #连接mydb数据库,没有则自动创建my_set = db.test_set#使用test_set集合,没有则自动创建

插入数据(insert插入一个列表多条数据不用遍历,效率高, save需要遍历列表,一个个插入)

my_set.insert({"name":"zhangsan","age":18})#或my_set.save({"name":"zhangsan","age":18})

插入多条

#添加多条数据到集合中users=[{"name":"zhangsan","age":18},{"name":"lisi","age":20}]  

my_set.insert(users)

#或my_set.save(users)

查询数据(查询不到则返回None)

#查询全部for i in my_set.find():    print(i)#查询name=zhangsan的for i in my_set.find({"name":"zhangsan"}):    print(i)print(my_set.find_one({"name":"zhangsan"}))

更新数据

my_set.update(   <query>,    #查询条件

<update>,    #update的对象和一些更新的 *** 作符   {

upsert: <boolean>,    #如果不存在update的记录,是否插入

multi: <boolean>,        #可选,mongodb 默认是false,只更新找到的第一条记录

writeConcern: <document>   #可选,抛出异常的级别。   }

)

把上面插入的数据内的age改为20

my_set.update({"name":"zhangsan"},{'$set':{"age":20}})

删除数据

my_set.remove(   <query>,    #(可选)删除的文档的条件   {

justOne: <boolean>,    #(可选)如果设为 true 或 1,则只删除一个文档

writeConcern: <document>   #(可选)抛出异常的级别   }

)

#删除name=lisi的全部记录my_set.remove({'name': 'zhangsan'})#删除name=lisi的某个id的记录id = my_set.find_one({"name":"zhangsan"})["_id"]

my_set.remove(id)#删除集合里的所有记录db.users.remove() 

mongodb的条件 *** 作符

#    (>)  大于 - $gt#    (<)  小于 - $lt#    (>=)  大于等于 - $gte#    (<= )  小于等于 - $lte

#例:查询集合中age大于25的所有记录for i in my_set.find({"age":{"$gt":25}}):    print(i)

type(判断类型)

#找出name的类型是String的for i in my_set.find({'name':{'$type':2}}):    print(i)

类型队对照列表

排序

在MongoDB中使用sort()方法对数据进行排序,sort()方法可以通过参数指定排序的字段,并使用 1 和 -1 来指定排序的方式,其中 1 为升序,-1为降序。

for i in my_set.find().sort([("age",1)]):    print(i)

limit和skip

#limit()方法用来读取指定数量的数据#skip()方法用来跳过指定数量的数据#下面表示跳过两条数据后读取6条for i in my_set.find().skip(2).limit(6):    print(i)

IN

#找出age是20、30、35的数据for i in my_set.find({"age":{"$in":(20,30,35)}}):    print(i)

OR

#找出age是20或35的记录for i in my_set.find({"$or":[{"age":20},{"age":35}]}):    print(i)

all

'''dic = {"name":"lisi","age":18,"li":[1,2,3]}

dic2 = {"name":"zhangsan","age":18,"li":[1,2,3,4,5,6]}

my_set.insert(dic)

my_set.insert(dic2)'''for i in my_set.find({'li':{'$all':[1,2,3,4]}}):    print(i)#查看是否包含全部条件#输出:{'_id': ObjectId('58c503b94fc9d44624f7b108'), 'name': 'zhangsan', 'age': 18, 'li': [1, 2, 3, 4, 5, 6]}

push/pushAl

my_set.update({'name':"lisi"}, {'$push':{'li':4}})for i in my_set.find({'name':"lisi"}):    print(i)#输出:{'li': [1, 2, 3, 4], '_id': ObjectId('58c50d784fc9d44ad8f2e803'), 'age': 18, 'name': 'lisi'}my_set.update({'name':"lisi"}, {'$pushAll':{'li':[4,5]}})for i in my_set.find({'name':"lisi"}):    print(i)#输出:{'li': [1, 2, 3, 4, 4, 5], 'name': 'lisi', 'age': 18, '_id': ObjectId('58c50d784fc9d44ad8f2e803')}

pop/pull/pullAll

#pop#移除最后一个元素(-1为移除第一个)my_set.update({'name':"lisi"}, {'$pop':{'li':1}})for i in my_set.find({'name':"lisi"}):    print(i)#输出:{'_id': ObjectId('58c50d784fc9d44ad8f2e803'), 'age': 18, 'name': 'lisi', 'li': [1, 2, 3, 4, 4]}#pull (按值移除)#移除3my_set.update({'name':"lisi"}, {'$pop':{'li':3}})#pullAll (移除全部符合条件的)my_set.update({'name':"lisi"}, {'$pullAll':{'li':[1,2,3]}})for i in my_set.find({'name':"lisi"}):    print(i)#输出:{'name': 'lisi', '_id': ObjectId('58c50d784fc9d44ad8f2e803'), 'li': [4, 4], 'age': 18}

多级路径元素 *** 作

先插入一条数据

dic = {"name":"zhangsan",       "age":18,       "contact" : {           "email" : "[email protected]",           "iphone" : "11223344"}

}

my_set.insert(dic)

#多级目录用. 连接for i in my_set.find({"contact.iphone":"11223344"}):    print(i)#输出:{'name': 'zhangsan', '_id': ObjectId('58c4f99c4fc9d42e0022c3b6'), 'age': 18, 'contact': {'email': '[email protected]', 'iphone': '11223344'}}result = my_set.find_one({"contact.iphone":"11223344"})print(result["contact"]["email"])#输出:[email protected]#多级路径下修改 *** 作result = my_set.update({"contact.iphone":"11223344"},{"$set":{"contact.email":"[email protected]"}})

result1 = my_set.find_one({"contact.iphone":"11223344"})print(result1["contact"]["email"])#输出:[email protected]

还可以对数组用索引 *** 作

dic = {"name":"lisi",       "age":18,       "contact" : [

{           "email" : "[email protected]",           "iphone" : "111"},

{           "email" : "[email protected]",           "iphone" : "222"}

]}

my_set.insert(dic)

#查询result1 = my_set.find_one({"contact.1.iphone":"222"})print(result1)#输出:{'age': 18, '_id': ObjectId('58c4ff574fc9d43844423db2'), 'name': 'lisi', 'contact': [{'iphone': '111', 'email': '[email protected]'}, {'iphone': '222', 'email': '[email protected]'}]}#修改result = my_set.update({"contact.1.iphone":"222"},{"$set":{"contact.1.email":"[email protected]"}})print(result1["contact"][1]["email"])#输出:[email protected]

python 访问 mongodb 需要先安装 pymongo,如下:

1pip install pymongo

txt 文件格式:

代码如下:

#coding=utf-8 from pymongo import MongoClient conn = MongoClient('127.0.0.1', 27017) # 连接 test 数据库,没有则自动创建db = conn.test   # 使用 students 集合,没有则自动创建students = db.students # 打开学生信息文件, 并将数据存入到数据库with open('students.txt', 'r') as f:         for line in f.readlines():                 # 分割学生信息        items = line.strip('\r').strip('\n').split(',')                 # 添加到数据库        students.insert({ 'stu_id': items[0], 'name': items[1], 'grade': int(items[2]) }) # 数据库查询学生信息并打印出来for s in students.find():    print(s)

模块

1.定义

计算机在开发过程中,代码越写越多,也就越难以维护,所以为了编写可维护的代码,我们会把函数进行分组,放在不同的文件里。在python里,一个.py文件就是一个模块

2.优点:

提高代码的可维护性。

提高代码的复用,当模块完成时就可以在其他代码中调用。

引用其他模块,包含python内置模块和其他第三方模块。

避免函数名和变量名等名称冲突。

python内建模块:

1.sys模块

2.random模块

3.os模块:

os.path:讲解

https://www.cnblogs.com/yufeihlf/p/6179547.html

数据可视化

1.matplotlib :

是Python可视化程序库的泰斗,它的设计和在1980年代被设计的商业化程序语言MATLAB非常接近。比如pandas和Seaborn就是matplotlib的外包,它们让你能用更少的代码去调用 matplotlib的方法。

访问:

https://matplotlib.org/ 

颜色:

https://www.cnblogs.com/darkknightzh/p/6117528.html

教程:

https://wizardforcel.gitbooks.io/matplotlib-user-guide/3.1.html

2.Seaborn:

它是构建在matplotlib的基础上的,用简洁的代码来制作好看的图表。Seaborn跟matplotlib最大的区别就是它的默认绘图风格和色彩搭配都具有现代美感。

访问:

http://seaborn.pydata.org/index.html

3.ggplot:

gplot 跟 matplotlib 的不同之处是它允许你叠加不同的图层来完成一幅图

访问:

http://ggplot.yhathq.com/

4.Mayavi:

Mayavi2完全用Python编写,因此它不但是一个方便实用的可视化软件,而且可以方便地用Python编写扩展,嵌入到用户编写的Python程序中,或者直接使用其面向脚本的API:mlab快速绘制三维图

访问:http://code.enthought.com/pages/mayavi-project.html

讲解:https://blog.csdn.net/ouening/article/details/76595427https://www.jianshu.com/p/81e6f4f1cdd8

5.TVTK:

TVTK库对标准的VTK库进行包装,提供了Python风格的API、支持Trait属性和numpy的多维数组。

VTK (http://www.vtk.org/) 是一套三维的数据可视化工具,它由C++编写,包涵了近千个类帮助我们处理和显示数据

讲解:https://docs.huihoo.com/scipy/scipy-zh-cn/tvtk_intro.html

机器学习

1.Scikit-learn

是一个简单且高效的数据挖掘和数据分析工具,易上手,可以在多个上下文中重复使用。它基于NumPy, SciPy 和 matplotlib,开源,可商用(基于 BSD 许可)。

访问:

讲解:https://blog.csdn.net/finafily0526/article/details/79318401

2.Tensorflow

最初由谷歌机器智能科研组织中的谷歌大脑团队(Google Brain Team)的研究人员和工程师开发。该系统设计的初衷是为了便于机器学习研究,能够更快更好地将科研原型转化为生产项目。

相关推荐:《Python视频教程》

Web框架

1.Tornado

访问:http://www.tornadoweb.org/en/stable/

2.Flask

访问:http://flask.pocoo.org/

3.Web.py

访问:http://webpy.org/

4.django

https://www.djangoproject.com/

5.cherrypy

http://cherrypy.org/

6.jinjs

http://docs.jinkan.org/docs/jinja2/

GUI 图形界面

1.Tkinter

https://wiki.python.org/moin/TkInter/

2.wxPython

https://www.wxpython.org/

3.PyGTK

http://www.pygtk.org/

4.PyQt

https://sourceforge.net/projects/pyqt/

5.PySide

http://wiki.qt.io/Category:LanguageBindings::PySide

科学计算

教程

https://docs.huihoo.com/scipy/scipy-zh-cn/index.html#

1.numpy

访问

http://www.numpy.org/ 

讲解

https://blog.csdn.net/lm_is_dc/article/details/81098805

2.sympy

sympy是一个Python的科学计算库,用一套强大的符号计算体系完成诸如多项式求值、求极限、解方程、求积分、微分方程、级数展开、矩阵运算等等计算问题

访问

https://docs.sympy.org/0.7.1/guide.html#guide 

讲解

https://www.jianshu.com/p/339c91ae9f41 

解方程

https://www.cnblogs.com/zyg123/p/10549354.html

3.SciPy

官网

https://www.scipy.org/

讲解

https://blog.csdn.net/wsp_1138886114/article/details/80444621

4.pandas

官网

http://pandas.pydata.org/

讲解

https://www.cnblogs.com/linux-wangkun/p/5903945.html

5.blaze

官网

http://blaze.readthedocs.io/en/latest/index.html

密码学

1.cryptography

https://pypi.python.org/pypi/cryptography/

2.hashids

http://www.oschina.net/p/hashids

3.Paramiko

http://www.paramiko.org/

4.Passlib

https://pythonhosted.org/passlib/

5.PyCrypto

https://pypi.python.org/pypi/pycrypto

6.PyNacl

http://pynacl.readthedocs.io/en/latest/

爬虫相关

requests

http://www.python-requests.org/

scrapy

https://scrapy.org/

pyspider

https://github.com/binux/pyspider

portia

https://github.com/scrapinghub/portia

html2text

https://github.com/Alir3z4/html2text

BeautifulSoup

https://www.crummy.com/software/BeautifulSoup/

lxml

http://lxml.de/

selenium

http://docs.seleniumhq.org/

mechanize

https://pypi.python.org/pypi/mechanize

PyQuery

https://pypi.python.org/pypi/pyquery/

creepy

https://pypi.python.org/pypi/creepy

gevent

一个高并发的网络性能库

http://www.gevent.org/

图像处理

bigmoyan

http://scikit-image.org/

Python Imaging Library(PIL)

http://www.pythonware.com/products/pil/

pillow:

http://pillow.readthedocs.io/en/latest/

自然语言处理

1.nltk:

http://www.nltk.org/

教程

https://blog.csdn.net/wizardforcel/article/details/79274443

2.snownlp

https://github.com/isnowfy/snownlp

3.Pattern

https://github.com/clips/pattern

4.TextBlob

http://textblob.readthedocs.io/en/dev/

5.Polyglot

https://pypi.python.org/pypi/polyglot

6.jieba:

https://github.com/fxsjy/jieba

数据库驱动

mysql-python

https://sourceforge.net/projects/mysql-python/

PyMySQL

https://github.com/PyMySQL/PyMySQL

PyMongo

https://docs.mongodb.com/ecosystem/drivers/python/

pymongo

MongoDB库

访问:https://pypi.python.org/pypi/pymongo/

redis

Redis库

访问:https://pypi.python.org/pypi/redis/

cxOracle

Oracle库

访问:https://pypi.python.org/pypi/cx_Oracle

SQLAlchemy

SQL工具包及对象关系映射(ORM)工具

访问:http://www.sqlalchemy.org/

peewee,

SQL工具包及对象关系映射(ORM)工具

访问:https://pypi.python.org/pypi/peewee

torndb

Tornado原装DB

访问:https://github.com/bdarnell/torndb

Web

pycurl

URL处理工具

smtplib模块

发送电子邮件

其他库暂未分类

1.PyInstaller:

是一个十分有用的第三方库,它能够在Windows、Linux、 Mac OS X 等 *** 作系统下将 Python 源文件打包,通过对源文件打包, Python 程序可以在没有安装 Python 的环境中运行,也可以作为一个 独立文件方便传递和管理。

2.Ipython

一种交互式计算和开发环境

讲解

https://www.cnblogs.com/zzhzhao/p/5295476.html

命令

ls、cd 、run、edit、clear、exist


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/bake/11737647.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-18
下一篇 2023-05-18

发表评论

登录后才能评论

评论列表(0条)

保存