python關於用beautifulsoup匹配標題並儲存

2021-06-28 17:22:48 字數 562 閱讀 9003

1樓:匿名使用者

# encoding: gbk

import urllib2

import re

from beautifulsoup import beautifulsoup

patt = re.compile(r'.*href="(.*?)/.*".*?', re.i|re.x) # 按需求更換regex

page=urllib2.urlopen("") # 按需求更換地址soup=beautifulsoup(page,fromencoding="gb2312") # 按需求更換編碼

for a in soup.findall('a'):

a = a.__str__('gb2312')m = patt.match(a)

if m:

print m.groups(0)[0]

2樓:匿名使用者

因為你講的不是很詳細,所以有可能的錯誤時這樣的,titletag的編碼格式和y不一致

試一下, titletag = titletag.__str__('gb2312')

python菜鳥問題關於python的菜鳥問題

python 2.x寫法 x 16 ans 0 while ans ans x ans ans 1 print ans python 3.x寫法 x 16 ans 0 while ans ans x ans ans 1 print ans 在ans ans 1 行與print ans 中插入一個空白...

新手開始學習Python,用Python2還是Python3比較好

2.x和3.x只有一些細微差別。學會任何一版的前提下,完全可以在一兩天之內,學會另外一版。真不知道這有什麼可糾結的 如果你沒有做好準備,拿出一兩年時間,而只是打算以 天 為單位,那無論學什麼語言,你也只能學到皮毛,python也是如此。而如果你已經決定用一兩年來學py,那也真的不差這一兩天時間。2t...

關於python版本的問題關於Python版本的問題?

目前大多數應用都是python 2.5 2.6的居多。很多外掛和庫都還停留在2.5 2.6階段,如果你去玩3.0,會發現很多擴充套件都沒有。可以說是如果你現在玩3.0 不實用 win上建議學2.6吧,linux上就玩2.5吧,py2.和py3.也並不是100 的不相容,python3.0只不過是對p...