1樓:匿名使用者
# encoding: gbk
import urllib2
import re
from beautifulsoup import beautifulsoup
patt = re.compile(r'.*href="(.*?)/.*".*?', re.i|re.x) # 按需求更換regex
page=urllib2.urlopen("") # 按需求更換地址soup=beautifulsoup(page,fromencoding="gb2312") # 按需求更換編碼
for a in soup.findall('a'):
a = a.__str__('gb2312')m = patt.match(a)
if m:
print m.groups(0)[0]
2樓:匿名使用者
因為你講的不是很詳細,所以有可能的錯誤時這樣的,titletag的編碼格式和y不一致
試一下, titletag = titletag.__str__('gb2312')
python菜鳥問題關於python的菜鳥問題
python 2.x寫法 x 16 ans 0 while ans ans x ans ans 1 print ans python 3.x寫法 x 16 ans 0 while ans ans x ans ans 1 print ans 在ans ans 1 行與print ans 中插入一個空白...
新手開始學習Python,用Python2還是Python3比較好
2.x和3.x只有一些細微差別。學會任何一版的前提下,完全可以在一兩天之內,學會另外一版。真不知道這有什麼可糾結的 如果你沒有做好準備,拿出一兩年時間,而只是打算以 天 為單位,那無論學什麼語言,你也只能學到皮毛,python也是如此。而如果你已經決定用一兩年來學py,那也真的不差這一兩天時間。2t...
關於python版本的問題關於Python版本的問題?
目前大多數應用都是python 2.5 2.6的居多。很多外掛和庫都還停留在2.5 2.6階段,如果你去玩3.0,會發現很多擴充套件都沒有。可以說是如果你現在玩3.0 不實用 win上建議學2.6吧,linux上就玩2.5吧,py2.和py3.也並不是100 的不相容,python3.0只不過是對p...