Python-- lxml安装

news/2024/7/7 13:28:21

       无论是使用爬虫框架scrapy,还是简单的requests请求后解析。都不可避免的需要使用html解析库。当然正则是可以代替一部分搜索。由于正则语法的晦涩,及其其他场景下,html解析是必不可少的。网上推荐 lxml的比较多,优点:稳定,高效。

       但是lxml的安装很难一次成功。

直接成功就不要接着看了。

pip install lxml 

在windows系统中安装时,可能会出现如下错误:

提示如下:

error: Microsoft Visual C++ 9.0 is required (Unable to find vcvarsall.bat). Get it from http://aka.ms/vcpython27

需要安装Microsoft Visual C++ 9.0,对应的是visual studio 2008版本。其实我们可以用一种更简单的方式来解决这个问题。

(1)首先升级下pip:

python -m pip install -U pip

(2)安装wheel

pip install wheel

(3)下载lxml对应python版本的wheel文件:下载地址(现在好像不能用了,可以根据你相应的Python去网上下载一个,这里我只有一个py37的,链接https://pan.baidu.com/s/1uGvrI12phytodE3diadxzg密码kd2h) 

 

其中cp27表示版本就是Python2.7,最后执行安装: 

  1. 下载相应版本的lxml-xx-xx-xx .whl文件,比如我的是lxml‑3.7.3‑cp37‑cp37m‑win_amd64.whl
  2. 进到whl文件的目录下,进入命令窗口,输入相应*.whl文件名,我的输入如下:
pip install  lxml‑3.7.3‑cp37‑cp37m‑win_amd64.whl

如果没有错误提示就代表安装成功。 


下面是一些不知道的问题,可以不用看。 

通常提示缺少libxml2,这是系统自带的版本太低。需要升级libxml2

ubuntu 下 
apt-get install libxml2-dev libxslt-dev python-dev

centos 下 
yum install libxml2-dev libxslt-dev python-dev

如果这样还不行,可以下载源代码,本地编译。

如果遇到这样的问题 

error: command 'gcc' failed with exit status 1

可能是因为环境:搬瓦工的256M内存,因为内存不够,每次便宜调用gcc 就被系统干掉,而且版瓦工采用的OpenVZ架构,除非重新换机房,否则不能添加临时swap.

方法一:找一个环境相同的系统,将lxml编译成一个wheel,拷贝过去安装。

这个法不行,手头没有这样的环境。

方法二:直接粗暴的吧本地的lxml这个在site-packet文件夹下的包copy过去了。

 


http://www.niftyadmin.cn/n/4487344.html

相关文章

hdu 3118 Arbiter

http://acm.hdu.edu.cn/showproblem.php?pid3118 题意:删除最少的边使图没有奇环二分图的定义:如果顶点能分为两个互不相交的子集,则图为二分图二分图的判定:如果二分图能黑白染色成功,则图为二分图而黑白染色&#x…

Python-- lxml用法

目录 lxml库(lxml安装可查看上一篇文章) Element类 1、节点操作 2、属性操作 3、文本操作 4、文件解析与输出 5、ElementPath 6、案例(尤其最后的一篇代码) lxml库(lxml安装可查看上一篇文章) py…

编写兼容android1.6的fragment

在通过声明方式在Android 3.0上使用Fragment中写的例子只能用在android3.0以上的版本。之前也测试过兼容1.6的方式,见编写最简单的Fragment。现在修改了android3.0的示例,可以兼容1.6版本了。 这是在nexus one 2.3.3下的截屏。项目本身使用的sdk是1.6。 …

Solr安装步骤

一、Solr概述 1、什么是Solr Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器。Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。 Solr可以独立运…

cowoa使用

1.下载cowoa最新版 下载地址:http://www.zen-cart.com/index.php?main_pageproduct_contrib_info&products_id1655 2.解压后,将admin、includes、optiondarrows拷贝到zencart的对应目录。注意Your-template改正为自己的模板名。 3、安装SQL脚本 cow…

Python-- CSS 选择器:BeautifulSoup4

目录 CSS 选择器:BeautifulSoup4 示例: 一、四大对象种类 1. Tag 2. NavigableString 3. BeautifulSoup 4. Comment 二、遍历文档树 1. 直接子节点 :.contents .children 属性 2. 所有子孙节点: .descendants 属性 3. 节点内容: …

C++之运算符重载(1)

在前一节中曾提到过,C中运行时的多态性主要是通过虚函数来实现的,而编译时的多态性是由函数重载和运算符重载来实现的。这一系列我将主要讲解C中有关运算符重载方面的内容。在每一个系列讲解之前,都会有它的一些基础知识需要我们去理解。而运…

精通黑客脚本 第二章笔记

2.1 Google Hack技术大演练 allintext:关键字,与intitle功能相同 intext:验证码 4800 cache:关键字 :搜索含有关键字内容cache。比如搜索北京大学网站服务器中缓存的内容,cache:pku.edu.cn define:关键字:搜索关键字的定义 filety…