Grosso modo, il y a combien de pages sur Internet ? - Sciences - Discussions
Marsh Posté le 07-02-2003 à 14:54:34
Je sais pas, je te dis ça dès que j'ai finis ....
Marsh Posté le 07-02-2003 à 14:58:33
Je croyais que blabla avait été fermé pourtant ...
Marsh Posté le 07-02-2003 à 14:59:29
Pseudo réponse:
2003 Google - Nombre de pages Web recensées par Google : 3,083,324,652
Marsh Posté le 07-02-2003 à 15:00:24
"Grosso modo, il y a combien de pages sur Internet ?"
Pourquoi les insulter ?
Marsh Posté le 07-02-2003 à 15:01:37
Nicobule a écrit : Pseudo réponse: |
sachant qu'une petite partie est référencée
Marsh Posté le 07-02-2003 à 15:03:49
sygus a écrit : |
Je sais ya que le statique de réferencé, mais ça peut l'aider un peu.
Marsh Posté le 07-02-2003 à 15:04:00
Bruce a écrit : "Grosso modo, il y a combien de pages sur Internet ?" |
Marsh Posté le 07-02-2003 à 15:06:09
Nicobule a écrit : |
Merci ! Il y en a qui bossent pendant que d'autres passent leur aprèm sur Discuss'
Marsh Posté le 07-02-2003 à 15:29:35
ReplyMarsh Posté le 07-02-2003 à 15:38:26
tristanf a écrit : on les estimais à 15 millions en 2001, il me semble |
qui "on" ? la concierge de ton immeuble ?
Puis on entend quoi par "page" ? ce forum ça compte ? pcq rien qu'ici y a des milliers/millions de pages possibles
Marsh Posté le 07-02-2003 à 15:50:22
antp a écrit : |
page centrale d'un même groupe exemple : forum.hardware.fr pas tt les topics...
Marsh Posté le 07-02-2003 à 15:52:58
antp a écrit : |
puis faudrais aussi definir ce ke l on appel page:
kan il y a des frames, c est koi ?
kan un site est fait avec une seul page dans lekel il y a un gigantesque anim flash ?
Marsh Posté le 07-02-2003 à 16:44:53
il y en a beaucoup, tu peux essayer de les compter si tu veux !
Marsh Posté le 02-03-2010 à 14:40:20
ReplyMarsh Posté le 02-03-2010 à 14:42:10
ReplyMarsh Posté le 02-03-2010 à 15:50:40
42
Marsh Posté le 02-03-2010 à 16:59:59
tristanf a écrit : page centrale d'un même groupe exemple : forum.hardware.fr pas tt les topics... |
Ben quand on parles de pages on parle de pages. On peut aussi compter les "sites" ou les "noms de domaines", mais c'est pas pareil.
HFR a plusieurs pages (sachant qu'elle sont générées dynamiquement, il en a même une infinité, c'est pour ça que c'est dur de toutes les compter). Quand le web était statique c'était facile, mais maintenant que le web est dynamique faudrait définir un concept de page compliqué si on veut répondre à la question...
Si on compte les pages indexées par google c'est plus de 10 milliards à l'heure actuelle (mais google est loin de tout indexer).
Par exemple, sur Wikipédia (anglophone) il y a 3,210,006 articles (tous indexés par google) mais en fait il y a 19,594,200 pages wiki (en comptant les pages de discussion, qui ne sont pas indexées et les redirect).
Si on compte les pages dynamiques c'est encore pire... En moyenne chaque article est édité 115 fois sur la Wikipédia anglophone... Donc pour chaque article il existe 115 pages correspondant aux anciennes versions de l'article, et (115*114)/2 "diff" (les diff sont les pages correspondant aux différences entre deux versions d'un même article, elle sont générées dynamiquement).
Donc rien qu'avec les articles, l'historique des articles et les diffs, Wikipédia a plus de 21 041 589 330 pages... Et Wikipédia n'est qu'une toute petite partie du web.
Marsh Posté le 02-03-2010 à 22:21:21
koko90, tu m'as etonne sur ce coup.
la vraie question, le nombre de 'page', quel interet a-t-il? la projection de l'enregistrement en papier sur ce en virtuel ne fonctionne pas.
Marsh Posté le 02-03-2010 à 22:48:48
L'idée est peut-être d'essayer de définir "page" comme étant quelque chose sur internet
-plus ou moins créé consciemment par un ou plusieurs humains
-évoquant vaguement les pages d'un livre ou d'un magazine
Et d'en estimer le nombre sur internet, à quelques milliards près.
Ca permettrait de savoir combien de ces pages ont été pondues par les internautes depuis la généralisation d'internet, ou sur internet en un an.
Et de comparer avec plein de choses : le nombre d'internautes, le nombre de pages de livres ou de magazines sur la même période, etc etc...
J'ai conscience des très grosses approximations qui seraient mises en oeuvre, et de l'intérêt à première vue limité d'une telle démarche.
Marsh Posté le 03-03-2010 à 09:19:47
alphaville a écrit : koko90, tu m'as etonne sur ce coup. |
A la base, la page web (un fichier html avec des images éventuellement liées) est une unité intéressante car élémentaire.
Mais de nos jours, le nombre de "pages" est infini (puisque certains sites peuvent générer dynamiquement une infinité de pages différentes).
Reste que les moteurs de recherche travaillent avec des pages (indexées par des URL uniques) et qu'ils arrivent à s'en tirer... J'ai pris l'exemple de Wikipédia pour expliquer à quel point ils n'indexent qu'une infime parti des pages qui existent (ce qui est normal, puisque le nombre de pages existant est arbitrairement grand, il faut qu'ils choisissent celles qui ont un réel contenu en évitant la redondance).
Les pages ne sont pas une bonne unité pour mesurer la taille du web. Mais le problème c'est qu'il n'y a pas de bonne unité pour mesurer la taille du web... Donc c'est perdu d'avance.
PS : Pour ceux qui connaissent la Bibliothèque de Babel de Jorge Luis Borges, elle est intégralement en ligne (et contient tout les ouvrages possibles et imaginables) :
http://www.babellibrary.com/index.cfm?lang=fr
Marsh Posté le 03-03-2010 à 12:21:13
Empificator a écrit : L'idée est peut-être d'essayer de définir "page" comme étant quelque chose sur internet |
je trouve l'idee de definir l'unite d'internet interessante. byte, debit, hit count, and so on... un autre topic peut-etre.
je ne vois toujours pas l'interet ni la possibilite de savoir le nombre de page sur l'internet, les 'pages' pouvant etre creees dynamiquement.
Koko90 a écrit : |
facile, on l'a appele une page au lieu de creer un autre mot. un html de 2 metre long a l'epoque (si si ca existait et existe encore) ne corresspond a ce que c'est, imfho. or, une piece de '.php' ou autre est capable de creer tant de differentes pages selon le IP du viewer, son browser, l'heure,... million de choses.
le nombre de "pages" est infini.
sinon borges
Marsh Posté le 03-03-2010 à 13:33:46
Je l'ai dit dès le départ. Le nombre de pages (avec la définition naïve du terme) est infini dénombrable. Donc on le connait.
Le nombre de noms de domaines est également infini (il existes des domaines du type "truc.com" où le nom de domaine "bidule.truc.com" est valide pour tout bidule).
Marsh Posté le 03-03-2010 à 13:48:22
Koko90 a écrit : Je l'ai dit dès le départ. Le nombre de pages (avec la définition naïve du terme) est infini dénombrable. Donc on le connait. |
sous-domaine
Marsh Posté le 03-03-2010 à 14:14:15
Il me semble que l'ensemble "bidule.truc.com" est bien un nom de domaine, avec com comme TLD, truc comme second-level domain et bidule comme third-level domain.
Les sous-domaines sont des cas particuliers de domaines...
Pour en revenir à la discussion, on veut compter un truc, on peut se limiter aux domaines du second ordre, mais c'est complètement artificiel (d'autant plus que ce sont déjà des sous-domaines des TLD)...
Marsh Posté le 03-03-2010 à 14:16:31
alphaville a écrit : je te hais, B-52. j'ai donne mes 7 dernieres annees et je continue a compter. |
moi je viens de finir la.
Tout ce que je peu dire c'est que ya moins de qualitay sur tout le net que dans ce topac!
Marsh Posté le 03-03-2010 à 14:36:28
Koko90 a écrit : Je l'ai dit dès le départ. Le nombre de pages (avec la définition naïve du terme) est infini dénombrable. Donc on le connait. |
Le nombre de caractères de chaque label (ce qui est séparé par un . dans un truc.foo.bar) est limité a 63.
Donc le nombre d'adresses de la forme truc.foo.bar est largement majoré (car en fait, la liste des labels autorisés pour la dernière partie est très limitée) par (63*1,114,111)^3 = 345785704704869176782657 [1,114,111 est le nombre de caracteres unicodes exprimables en utf-8]. Bref, ce nombre est grand, mais pas infini.
A+,
Marsh Posté le 03-03-2010 à 14:43:56
J'ai en effet oublié de tenir compte de la limitation de la longueur des label.
Reste que ton calcul me semble faux, ça devrait plutôt faire du (X^63)^3... où X est le nombre de caractères autorisés.
Par ailleurs X n'est pas égal à 1,114,111 (il me semble que les caractères unicodes exprimables en utf-8 ne sont pas tous autorisés).
Marsh Posté le 03-03-2010 à 14:57:26
Citation : J'ai en effet oublié de tenir compte de la limitation de la longueur des label. |
Réflexe d'informaticien: c'est surement implémenté dans des tables de taille fixe
Citation : (X^63)^3. |
C'est ca en effet. Donc X^189
Citation : X n'est pas égal à 1,114,111 |
Je ne l'ai jamais prétendu. Mais c'en est un majorant.
A+,
Marsh Posté le 03-03-2010 à 15:01:01
kriloner a écrit : |
attends, tu n'as encore vu que les preliminaires ici
Marsh Posté le 03-03-2010 à 15:03:44
gilou a écrit : C'est ca en effet. Donc X^189 |
multiplier par le nombre de pages (visuel) potentiellement generables par chaque domain/sous-domain, si on veut rester dans le sujet
Marsh Posté le 03-03-2010 à 15:05:19
alphaville a écrit : multiplier par le nombre de pages (visuel) potentiellement generables par chaque domain/sous-domain, si on veut rester dans le sujet |
Vu que tu as des serveurs php qui vont te générer une page pour toute requête avec une chaine en parametre, le nombre en est infini dénombrable.
Donc, pour répondre a la question initiale:
Q - Grosso modo, il y a combien de pages sur Internet ?
R -
A+,
Marsh Posté le 03-03-2010 à 15:36:53
Y doit bien y avoir une limite à la con dans le protocole HTTP sur la taille maximale d'une page...
PS : Ah ben non, dans le RFC 2616 y en a pas. Mais bon, les navigateurs et les serveurs ont forcément une limitation...
Marsh Posté le 03-03-2010 à 17:10:52
Koko90 a écrit : Y doit bien y avoir une limite à la con dans le protocole HTTP sur la taille maximale d'une page... |
Si c'était le cas, un serveur web "a la bibliothèque de Babel de Borgès" contiendrait tout internet
Mais comme le dit la RFC 2616:"Any Content-Length greater than or equal to zero is a valid value."
A+,
Marsh Posté le 07-02-2003 à 14:50:52
Juste histoire d'avoir un ordre d'idée ... je sais que déjà le nombre de pages qui apparaissent tout les mois est gigantesque ...
---------------
Securis c'est plus de 200 logiciels de sécurité gratuits !