twitterAPI获取和使用(pythontweepy库)

17-08-25 来源：[db:作者]

收藏我要投稿

看《Python 数据挖掘与与入门》这本书的时候有几章的内容需要使用Twitter获取Twitter的数据,在书中作者使用的是Twitter 官方出的那个库,但是由于国内需要科学上网,这个库好像不支持使用代理,因此我就换了tweepy这个库.

首先你需要可以科学上网,装好tweepy这个库,去http://apps.twitter.com这个网址点Create New App 填写之后申请好你就有了下面的这些参数

import tweepy
import json

consumer_key = "你的参数"
consumer_secret = "你的参数"
access_token = "你的参数"
access_token_secret = "你的参数"

auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
api = tweepy.API(auth,proxy='127.0.0.1:1080')

在ie浏览器->工具->Internet选项->连接->局域网设置检查你的代理的设置,否则就把代理给勾上(就这几个地方设置好应该就可以了,如果没好,请自行百度)

tweepy 这个库的资料比较少,我自己摸索着试了试,把代码发上来

一.按照关键字搜索Twitter的内容

#接上面的代码(q = 关键字 ,count = 返回的数据量 . 推特一次最多返回100条??)
search_results = api.search(q='python',count=100)

#对对象进行迭代
for tweet in search_results:
    #tweet还是一个对象,推特的相关信息在tweer._json里
    #这里是检测消息是否含有'text'键,并不是所有TWitter返回的所有对象都是消息(有些可能是用来删除消息或者其他内容的动作--这个没有确认),区别就是消息对象中是否含有'text'键
    if 'text' in tweet._json:
        print(tweet._json['text'])
        #这里是把内容给打印出来了,如果需要保存到文件需要用json库的dumps函数转换为字符串形式后写入到文件中
        #例如 :output_file.write(json.dumps(tweet._json))

二.根据Twitter消息的ID批量获取消息

#其中id_list 是消息ID组成的list 长度也不要超过100
search_result = api.statuses_lookup(id_list)

点击复制链接与好友分享!回本站首页