Loading...
前几天看到一个阿朱的写真网站,心想留下地址,以后爬取练手,今天匆匆忙忙的很晚了赶来第一次练手,爬取是成功的,写的有点乱,暂时记录一下,以后有待优化 import requests import ...
照着书上的例子,所有代码照敲,发现爬不了,于是自己动手修改一下,连爬取的页面都该为hot了,可是发现好像是编码的问题,于是卡住了 经过1个小时的奋斗,被我修改了一下,但是由于这个直接抓取hot在...
刚学会正则,想着把我之前爬的教学课程代码优化一下,整了大半夜了发现无法匹配import os import re import requests download_path = './所有课本...
Python有一个re模块 import re 正则表达式并非python独有,它也可以用在其他编程语言中,python的re库提供了整个正则表达式的实现. import re re.match...
这里我测试了一下爬取豆瓣电影top250的所有图片,为了便于测试,我没有每一页进入爬取大图,只是在每个list抓取小图,测试结果是成功的,接下来继续测试python的多线程给爬虫提速.#codi...
import os os.system('title 计算平方使用 @小伍的游乐场 E_Page') #设置窗口标题 def power(x,n): s = 1 while n ...
#coding:utf-8 import os from fake_useragent import UserAgent import requests from bs4 import Beau...
#第一段,语法糖 l = [i for i in range(10)] print(l) #接下来,一般的写法是如下的 l = [] for i in range(10): l.ap...
#coding:gbk #用class来创建类,我这里创建了一个叫做Dog的类,在python3.X版本中Dog后面的括号内可以留空 #记得括号后需要加冒号 #init是一个特殊的内置方法,造做...
用conda命令进行安装的话,就可以了:conda install -c simonflueckiger tesserocr pillow要带上参数,不然还是安装失败。这个方法亲测有效。 另外...
#coding:gbk import pandas as pd import matplotlib.pyplot as plt #设置这个就可以显示中文了 plt.rcParams['font....
#coding:gbk import pandas as pd #DataFrame 数据帧,相当于工作簿中的一个表 df = pd.DataFrame({'id':[1,2,3,4],'na...
Python pip替换为阿里源 由于 python 自带的源下载速度非常慢,特别是安装一些库的时候,甚至有时会失败。替换 首先在 windows 当前用户家的目录下,创建一个 pip 文件夹,...
python在对比两个文件内容或字符串时,要注意文件是否有换行符,否则结果会一直提示错误。#python 3.x #python 对比两个文件内容with open('test1.txt') a...
调试(Debugging) 利用好调试,能大大提高你捕捉代码Bug的。大部分新人忽略了Python debugger(pdb)的重要性。 在这个章节我只会告诉你一些重要的命令,你可以从官方文档中...
装饰器能有助于检查某个人是否被授权去使用一个web应用的端点(endpoint)。它们被大量使用于Flask和Django web框架中。这里是一个例子来使用基于装饰器的授权:from func...
装饰器装饰器(Decorators)是Python的一个重要部分。简单地说:他们是修改其他函数的功能的函数。他们有助于让我们的代码更简短,也更Pythonic(Python范儿)。大多数初学者不...
三元运算符三元运算符通常在Python里被称为条件表达式,这些表达式基于真(true)/假(not)的条件判断,在Python 2.4以上才有了三元操作。下面是一个伪代码和例子:伪代码:#如果条...
set(集合)数据结构set(集合)是一个非常有用的数据结构。它与列表(list)的行为类似,区别在于set不能包含重复的值。这在很多情况下非常有用。例如你可能想检查列表中是否包含重复的元素,你...
任意对象,只要定义了next(Python2) 或者__next__方法,它就是一个迭代器。就这么简单。现在我们来理解迭代(iteration)用简单的话讲,它就是从某个地方(比如一个列表)取出...