Question Parser des fichier html

Plus d'informations
il y a 16 ans 7 mois #5038 par Alan Pinard
Bonjour,

J'aimerais savoir quel est la meilleur méthodes concernant le parsing de page web ou de fichier HTML.

J'essaie depuis quelques jours de trouver soit une classe .NET ou une cmdlet qui me permettrait par exemple de retirer l'information entre les balise <a> ou <h1> mais c'est sans succès.

Je sais pas non plus si je devrais utiliser les expressions régulière.

J'ai remarqué qu'il y avait des trucs sous powershell pour faire exactement ce que je veux mais pour les fichiers XML.

Est-ce que j'ai passé à côté de quelques chose pour le HTML?

Merci,

Alan Pinard

Alan Pinard
Version A

Connexion ou Créer un compte pour participer à la conversation.

Plus d'informations
il y a 16 ans 7 mois #5113 par Laurent Dardenne
Réponse de Laurent Dardenne sur le sujet Re:Parser des fichier html
Salut,
Versiona écrit:

J'ai remarqué qu'il y avait des trucs sous powershell pour faire exactement ce que je veux mais pour les fichiers XML.

Est-ce que j'ai passé à côté de quelques chose pour le HTML?

Non.
Comme tu le dis .NET gére le XML mais pas le HTML.

Consulte ceci, Parsing HTML in .NET
Un court exemple en PS ( cf commentaires)

Ou une autre direction .<br><br>Message édité par: Laurent Dardenne, à: 17/08/09 19:48

Tutoriels PowerShell

Connexion ou Créer un compte pour participer à la conversation.

Plus d'informations
il y a 16 ans 6 mois #5250 par Alan Pinard
Réponse de Alan Pinard sur le sujet Re:Parser des fichier html
Bonjour,

Merci pour la réponse je vais y jeter un coup d'oeil!

Alan Pinard
Version A

Alan Pinard
Version A

Connexion ou Créer un compte pour participer à la conversation.

Temps de génération de la page : 0.046 secondes
Propulsé par Kunena