¿Cómo hago que LINQ to XML y HTML funcionen juntos?

votos
1

Tengo una tabla html

  <table border=0 width=100%>
        <tr class=headerbg>
            <th width=5%>
                No
            </th>
            <th width=30%>
                Name
            </th>
            <th width=20%>
                Department or Division
            </th>
            <th width=25%>
                Email
            </th>
            <th width=20%>
                Staff/Student
            </th>
        </tr>
        <tr class=bg2>
            <td>
                1
            </td>
            <td>
                <strong><a class=searchLink2 href=tel_search.php?fore=Dave&amp;sur=Rumber>Dave Rumber</a></strong>
            </td>
            <td>
                Medical School
            </td>
            <td>
                <a class=searchLink2 href=mailto:Dave.Rumber@Home.com>Dave.Rumber@Home.com</a>
            </td>
            <td>
                Student&nbsp;
            </td>
        </tr>
    </table>

A veces habrá más de una fila de resultados de personas. Me gustaría poder revisar cada fila y obtener el nombre y la información del correo electrónico y hacer otro procesamiento. Coloque los datos en una cuadrícula de datos, y posiblemente en una base de datos.

Supongo que mi pregunta es ¿cómo hago esto?

  string table = GetContents(buffer);

  table = table.Replace(&nbsp;, );
  table = table.Replace(&, &amp;);

  XElement inters = XElement.Parse(table);

Puedo ponerlo en un XElement pero no estoy muy seguro de a dónde ir.

¡Gracias!

Publicado el 09/12/2008 a las 18:43
fuente por usuario
En otros idiomas...                            


2 respuestas

votos
1

Aquí hay un código a mano alzada que debería comenzar. No hagas esto en producción, esta es una demostración educativa solamente.

List<XElement> rows = inters
  .Descendants
  .Where(x => x.Name == "tr")
  .Skip(1) //header
  .ToList();
//
// and now to turn rows into people
List<Person> people = rows
  //filter to anchor.  should be two.
  .Select(r => r.Descendants.Where(a => a.Name = "a"))
  //Project each anchor pair into a Person
  .Select(g => new Person()
  {
    Name = g.First().Value,
    Email = g.Skip(1).First().Value
  })
  .ToList();
Respondida el 09/12/2008 a las 20:46
fuente por usuario

votos
1

En realidad, puede usar una tabla HTML como fuente de datos para OLE DB:

http://connectionstrings.com/html-table

Divulgación completa: en realidad no he intentado esto, pero supongo que será mucho más fácil que tratar de analizar XML de HTML.

Respondida el 09/12/2008 a las 18:46
fuente por usuario

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more