Cамоучитель по VB.NET

         

Сетевые потоки



Среди областей, в которых особенно наглядно проявляются возможности абстрактной модели потока, особое место занимает пересылка информации в Интернете. Работа с низкоуровневым кодом HTML и XML почти не требует усилий со стороны программиста. Хотя в этом разделе мы сможем дать лишь общее представление об этой важной теме и о задействованных пространствах имен, по крайней мере вы увидите, как потоковая интерпретация сетевых данных реализуется на практике. В рассмотренном ниже примере мы передаем информацию на web-сайт и получаем непосредственный HTML-код новой страницы в качестве результата запроса. Анализ полученного HTML-кода приносит нужную информацию.

Мы не смогли устоять перед искушением: наше маленькое приложение обращается на сайт Amazon.com и возвращает текущие сведения о количестве проданных экземпляров нашей книги. Обобщенный алгоритм выглядит следующим образом:

  1. Создать объект URI (Universal Resource Locator) передачей строкового параметра конструктору класса URI.
  2. Передать объект URI методу Create класса HttpWebRequest, чтобы инициировать выдачу запроса HTTP.
  3. Вызвать метод GetResponse класса HttpWebRequest и получить поток.
  4. Проанализировать полученный поток, содержащий HTML-код, и извлечь из него нужную информацию, для чего необходимо знать структуру страницы. Кстати, это одна из причин, по которым для получения данных удобнее использовать web-службы: если Amazon неожиданно сменит структуру своих страниц, наше приложение перестанет работать.

В данном случае страница генерируется следующей строкой запроса, которая и будет использована для создания объекта URI (в конце строки приведен номер ISBN нашей книги):

http://www.amazon.com/exec/obidos/ASIN/1893115992

Следующий конструктор создает экземпляр класса с номером ISBN, переданным в виде строкового параметра:

Public Sub New(ByVal ISBN As String)

m_URL ="http://wvM.amazon.com/exec/obidos/ASIN/" & ISBN

End Sub

Доступное только для чтения свойство GetRank нашего класса просто вызывает закрытую функцию, основной код которой приведен в следующих восьми строках:

1 Dim theURL As New URI(m_URL)

2 Dim theRequest As WebRequest

3 theRequest = WebRequest.Create(theURL)

4 Dim theResponse As WebResponse

5 theResponse = theRequest.GetResponse

6 Dim aReader As New StreamReader(theResponse.GetResponseStream())

7 Dim theData As String .

8 theData = aReader.ReadToEnd

В строке 1 создается объект класса URI. В строках 2 и 3 генерируется web-запрос, передаваемый на сайт Amazon.com. Строки 4 и 5 принимают ответ на запрос, а в строке 6 метод GetResponseStream класса Response конструирует объект StreamReader для полученного потока. На этой стадии строковая переменная theData содержит низкоуровневый HTML-код web-страницы нашей книги.

<font face=verdana.arial.helvetica size=-l>

<b>Amazon.com Sales Rank:</b>

5.776

</font><br>

Остается лишь проанализировать переменную theData и извлечь из нее данные о продажах. Для этого мы воспользуемся вспомогательной функцией Analyze:

Private Function Analyze(ByVal theData As String)As Integer

Dim Location As Integer

Location - theData.IndexOf("<b>Amazon.com Sales Rank:</b>")

+ "<b>Amazon.com Sales Rank:</b>".Length

Dim temp As String

Do Until theData.Substring(Location.l) = "<" temp = temp

StheData.Substring(Location.l)

Location += 1

Loop

Return CInt(temp)

End Function

Для анализа строковой переменной также можно воспользоваться классом регулярных выражений из пространства имен System.Text.

Ниже приведен полный код тестового модуля (разумеется, для тестирования вам также понадобится Интернет-соединение):

Option Strict On Imports System.IO Imports System.Net

Module Module1

Sub Main()

Dim myBook As New AmazonRanker("1893115992")

MsgBox("This book's current rank is " & myBook.GetRank)

End Sub

End Module

Public Class AmazonRanker

Private m_URL As String

Private m_Rank As Integer

Public Sub New(ByVal ISBN As String)

m_URL = "http://www.amazon.com/exec/obidos/ASIN/" & ISBN

End Sub

Public Readonly

Property GetRank() As Integer

Get Return ScrapeAmazon()

End Get End Property

Private Function ScrapeAmazon() As Integer Try

Dim theURL As New URI(m_URL)

Dim theRequest As WebRequest

theRequest = WebRequest.Create(theURL)

Dim theResponse As WebResponse

theResponse = theRequest.GetResponse

DimaReaderAsNew

StreamReader(theResponse.GetResponseStream())

Dim theData As String

theData = aReader.ReadToEnd

Return Analyze(theData) Catch E As Exception

Console.WriteLine(E.StackTrace)

Console. ReadLine()

End Try

End Function

Private Function Analyze(ByVal theData As String) As Integer

Dim Location As Integer

Location = theData.IndexOf("<b>Amazon.com Sales Rank:</b>") + "<b>Amazon.com

Sales Rank:</b>".Length Dim temp As String

Do Until theData.Substring(Location.l) = "<" temp - temp

&theData.Substring(Location,l) Location += 1 Loop

Return CInt(temp)

End Function

End Class

Пример этой программы наглядно показывает, какие неуловимые проблемы порой возникают в результате локализации. Когда наш друг запустил эту программу в Европе, она отказалась работать. Оказалось, что на сайте Amazon по вполне понятным причинам используется американский числовой формат, а программа запускалась в европейской версии Windows, в результате чего символ «,» интерпретировался неверно. Разумеется, проблема легко решается — достаточно, чтобы функция возвращала значение строкового типа.



Содержание раздела