Книга Автостопом по Python онлайн (страница 241)

Последние комментарии

Все и сразу!

а мне зашло, вроде Фанфик (ну так жанр указан) а читается очень даже!

Госпожа наместница

Понравилась. Очень люблю этого автора у него всегда вкусно написано, грамотно и по-настоящему увл...

Стоящие за твоим плечом

Прочитал книгу "Стоящие за твоим плечом" впечатления очень хорошие. Читается с интересом, а идея ...

Атлант расправил плечи

Не ищите здравый смысл. Поиски смысла- критерий бессмыслия. В природе смысла нет. Его нет и ни в ...

Три товарища

Я нашла ее сама, случайно, среди огромного океана мировой классики, и почему-то сразу почувствова...

Идиот

Начала читать Достоевского Идиота чтобы хоть как то прийти в себя после последней книги. Во второ...

Три товарища

книга, которую я купил в бумажном виде и пополнил свою небольшую библиотеку. рекомендую!

Цветы для Элджернона

сначала немного не понял, а потом как понял. Одна из лучших книг, которые я читал

Проект «Аве Мария»

скорее бы уже экранизация, книга супер, видел трейлеры, фильм похоже будет тоже классным

Зулейха открывает глаза

В целом книга оставила нейтральное впечатление, она ни откровенно плохая, ни понастоящему сильная...

Наука и образованиеАвтостопом по Pythonстр 241

Светлый фон

Теперь дерево содержит весь файл HTML и имеет удобную структуру. Мы можем пойти двумя путями: использовать XPath (http://lxml.de/xpathxslt.html) или CSSSelect (http://lxml.de/cssselect.html). Оба этих способа стандартные для указания пути с помощью дерева HTML, они определены и поддерживаются World Wide Web Consortium (W3C) и реализованы как модули в lxml. В этом примере мы используем XPath. Руководство по XPath (http://www.w3schools.com/xsl/xpath_intro.asp) поможет вам начать работу.

Существуют различные инструменты для получения XPath элементов изнутри вашего браузера вроде Firebug for Firefox или Chrome Inspector. Если используете Chrome, щелкните правой кнопкой мыши на элементе, выберите пункт меню Inspect element (Инспектировать элемент), подсветите код, снова щелкните правой кнопкой и выберите Copy XPath (Скопировать XPath).

После небольшого анализа мы видим, что данные на нашей странице содержатся в двух элементах: div (с заголовком buyer-name) и span (имеющий класс item-price):

<div title="buyer-name">Carson Busses</div>

<span class="item-price">$29.95</span>

Зная это, мы можем создать корректный запрос XPath и использовать lxml-функцию xpath, как показано в примере:

# Это создаст список покупателей:

buyers = tree.xpath('//div[@title="buyer-name"]/text()')

# Это создаст список цен

prices = tree.xpath('//span[@class="item-price"]/text()')

Посмотрим, что получилось:

>>> print('Buyers: ', buyers)

Buyers: ['Carson Busses', 'Earl E. Byrd', 'Patty Cakes',

'Derri Anne Connecticut', 'Moe Dess', 'Leda Doggslife', 'Dan Druff',

'Al Fresco', 'Ido Hoe', 'Howie Kisses', 'Len Lease', 'Phil Meup',

'Ira Pent', 'Ben D. Rules', 'Ave Sectomy', 'Gary Shattire',

'Bobbi Soks', 'Sheila Takya', 'Rose Tattoo', 'Moe Tell']

>>>

>>> print('Prices: ', prices)

Prices: ['$29.95', '$8.37', '$15.26', '$19.25', '$19.25',