Aujourd’hui je vous propose de réaliser une petite application qui va se connecter à un site et qui va aller télécharger un fichier. Le meilleur dans l’histoire c’est que tout cela va se faire automatiquement sans que vous ayez à lever le petit doigt. De la magie ? Non, nous devons cela à la gem Mechanize que je vais vous présenter sans plus attendre.
Si vous testez ce code, il y a de grandes chances que vous trouviez des erreurs et que votre programme n’aboutit pas. Pourquoi ? Tout simplement parce qu'il est possible que le Google que j'ai en ce moment change un peu d'interface, même d'une seule balise et le Css Path et le Xpath changent. Donc pour faire fonctionner ce bout de code il faut impérativement les mettre à jours. La deuxième raison est que certains navigateurs possèdent la saisie instantanée. Du coup dès que vous tapez quelque chose Google vous génère des résultats en direct et change votre page, donc votre Xpath ou Css Path aura changé également. Une alternative à ce problème est qu'au lieu de cliquer sur le bouton rechercher de la barre de Google qui change de Xpath à longueur de temps, nous allons envoyer une validation (touche Entrée) par clavier avec ce code-là : barre_rechercher.send_keys(Keys.ENTER)
des outils de compréhension de la structure des systèmes et de leur comportement, et une composante pratique car l'automatique a pour fin de faire fonctionner des systèmes en minimisant l'intervention humaine pour éviter toutes sortes de tâches fastidieuses, répétitives ou dangereuses, et donc d'en permettre l'automatisation […] Lire la suite☛ http://www.universalis.fr/encyclopedie/automatique/#i_2513
PhantomJS va nous servir de "Web-Driver" et cela sera là son unique utilité. De quoi s'agit-il ? Afin que Python puisse interagir avec le navigateur Web (Chrome, Firefox ou autres), de la même manière que la communication avec une base de données, il nous faut un driver (pilote). C'est là qu'intervient le Web Driver, il permet la communication entre le navigateur Web et notre script Python. De base, Selenium peut utiliser différents drivers pour différents navigateurs (Chrome, Firefox, Opéra) mais ce qui nous intéresse, ce n'est pas d'ouvrir un navigateur mais d'avoir un navigateur headless (sans interface graphique, uniquement en ligne de commandes). C'est là qu'intervient PhantomJS, qui fournit lui-même son Web Driver. L'utilité c'est donc la rapidité d'exécution par rapport aux navigateurs classiques.
×