中文领域:
指的是提取境内地址的经纬度,的主要调用的是百度API。中间经历了一些波折,刚开始直接使用网上代码debug半天都不行,才发现要随时跟进官方改动,使用别人的API一定要看说明书啊!
首先需要从百度地图平台上注册一个AK(在这之前要注册百度的开发者身份,免费),进入其地理编码网址:
http://lbsyun.baidu.com/index.php?title=webapi/guide/webservice-geocoding
页面:
由于我们是要从地址转换经纬度,因此看地理编码就可以了。
官网给出了服务文档(千万要看),因为爬取地址时需要提供url,这个url必须和官方提供的一致。这里需要注意两点:
1. 网上有的代码里给出的是v2,但是现在已经更新到了v3
2. 中文需要编码,使用urllib.request库里的quote默认的就行,但是可能在别的网址中会使用非大众的汉字编码方式,这个时候可以查一下相应的编码并encode一下
import json from urllib.request import urlopen, quote import requests def getlnglat(address): url = 'http://api.map.baidu.com/geocoding/v3/' output = 'json' ak = '你的AK' # 百度地图ak,具体申请自行百度,提醒需要在“控制台”-“设置”-“启动服务”-“正逆地理编码”,启动 address = quote(address) # 由于本文地址变量为中文,为防止乱码,先用quote进行编码 uri = url + '?' + 'address=' + address + '&output=' + output + '&ak=' + ak +'&callback=showLocation%20'+'//GET%E8%AF%B7%E6%B1%82' # req = urlopen(uri) # res = req.read().decode() 这种方式也可以,和下面的效果一样,都是返回json格式 res=requests.get(uri).text temp = json.loads(res) # 将字符串转化为json lat = temp['result']['location']['lat']