Comment Optimiser l'execution du code avec GCC ??

Comment Optimiser l'execution du code avec GCC ?? - C - Programmation

Marsh Posté le 27-05-2007 à 01:00:53    

Salut,
 
Bon bah, quasiment tout est dit dans le sujet !!
Le code est optimiser à fond, pas de malloc inutiles etc (Char à la palce de Int etc ...)
J'aurais voulu savoir comment optimiser plus avec Gcc.
J'utilise la ligne de compilation suivante :
 
" gcc -I. -W -Wall -pedantic -ansi -O3 -g3 -Wstrict-prototypes -S -fsigned-bitefields -fno_default_inline -p -Winline -mcpu=i386 "
 
Je vous demande ca car je pense qu'il y a sans doutes plus d'options pour optimiser que -O3, j'aimerais bien que vous éclairiez ma lanterne XD.
 
Merci d'avance !


---------------
Benchmarks du peuple - Crysis War - Vide grenier ! - nVIDIA Tegra
Reply

Marsh Posté le 27-05-2007 à 01:00:53   

Reply

Marsh Posté le 27-05-2007 à 03:04:44    

Char plus rapide que int ? Vous avez fait des tests ?
Théoriquement c'est le contraire car au niveau  interne, les opérations se font au minimum sur 16 bits et quand il n'y a que 8 bits, cela oblige à un masquage. Mais de toutes manières la différence est tellement minime entre les deux que cela ne devrait pas se sentir sauf si vous faîtes du calcul vraiment intensif.
Eviter les malloc est en effet une bonne chose. Vous les remplacer par quoi ? Par des données statiques, des données sur la piles, en registres ?
Si vous postiez ici la partie de votre programme qui prend le plus de temps, il y aurait très probablement quelques personnes qui pourraient vous proposer des optimisations.

Reply

Marsh Posté le 27-05-2007 à 09:26:56    

olivthill a écrit :

au niveau  interne, les opérations se font au minimum sur 16 bits et quand il n'y a que 8 bits, cela oblige à un masquage.


Cela est completement dependant de l'architecture cible, et ca n'est pas vrai dans le cas de l'architecture intel classique (les pc, quoi).  
 
kaiser >> ton code n'est pas assez rapide? as-tu essaye de le profiler pour voir ce qui prenait du temps?

Reply

Marsh Posté le 27-05-2007 à 11:03:46    

Citation :

kaiser >> ton code n'est pas assez rapide? as-tu essaye de le profiler pour voir ce qui prenait du temps?


 
En faite le but c'est de faire un programme qui resoud des sudoku ( Pour l'instant le teste est fait sur 10 maps d'affile. A la fin se sera entre 100 et 1000 maps), mais le plus rapidement possible.
Notre but c'est d'optimiser un code avec Bruit de Force.
Quand je dis optimisation, c'est niveau de la taille de l'executable, de la bouffe de memoire lors de l'execution, et du temps d'execution.
 

Citation :

 Char plus rapide que int ? Vous avez fait des tests ?
Théoriquement c'est le contraire car au niveau  interne, les opérations se font au minimum sur 16 bits et quand il n'y a que 8 bits, cela oblige à un masquage. Mais de toutes manières la différence est tellement minime entre les deux que cela ne devrait pas se sentir sauf si vous faîtes du calcul vraiment intensif.
Eviter les malloc est en effet une bonne chose. Vous les remplacer par quoi ? Par des données statiques, des données sur la piles, en registres ?
Si vous postiez ici la partie de votre programme qui prend le plus de temps, il y aurait très probablement quelques personnes qui pourraient vous proposer des optimisations.


 
Le char a la place de int c'est surtout pour la bouffe lors de l'execution, mais j'ai remis les int pour l'optimisation du temps d'execution.
Apres oui les mallocs sont change par des donnees statiques.


---------------
Benchmarks du peuple - Crysis War - Vide grenier ! - nVIDIA Tegra
Reply

Marsh Posté le 27-05-2007 à 11:32:02    

kaiser52 a écrit :

En faite le but c'est de faire un programme qui resoud des sudoku ( Pour l'instant le teste est fait sur 10 maps d'affile. A la fin se sera entre 100 et 1000 maps), mais le plus rapidement possible.
Notre but c'est d'optimiser un code avec Bruit de Force.


? faut qu'ça pète quoi.
 

Citation :

Quand je dis optimisation, c'est niveau de la taille de l'executable, de la bouffe de memoire lors de l'execution, et du temps d'execution.


En général, le compilateur ne joue pas sur les trois tableaux. Puisque tu utilises GCC ; celui-ci a des options pour optimiser en vitesse (-O3), et pour optimiser en taille (-Os). Pour ce qui est de la consommation mémoire, je ne suis pas sur, mais il me semble que GCC n'influe pas trop là-dessus.
 
Ce que tu à l'air de vouloir, c'est de l'optimisation en vitesse, -O3 est à priori un bon choix. Après GCC a bien d'autres options, mais pour te conseiller, il faudrait que tu donnes la version de GCC que tu utilises.  
 

Citation :

" gcc -I. -W -Wall -pedantic -ansi -O3 -g3 -Wstrict-prototypes -S -fsigned-bitefields -fno_default_inline -p -Winline -mcpu=i386 "


Mais même sans connaitre la version de GCC, tu peux enlever -g3, c'est le plus haut niveau d'information de debuggage, ton binaire va alors bien maigrir. Enlève aussi -p quand tu ne profile pas.
Tu peux essayer -fomit-frame-pointer -DNDEBUG si tu n'a pas besoin de debugger, et que tu penses utile de désactiver les assert.
 
au lieu de -mcpu=i386, tu peux essayer -march=xxx en spécifiant ton processeur - cf man gcc.
 
Et -Wl,-s pour stripper le binaire plus -Wl,-O1 pour optimiser le link.

Reply

Marsh Posté le 27-05-2007 à 11:33:27    

ça fait plaisir les gens qui ont le soucis de la performance avant d'écrire un programme correct. Et laisse tranquille se malloc, si c'est lent, c'est que tes algos sont pourris. Va pas chercher ailleurs l'explication de tes lenteurs ailleurs (enfait je suis sur que t'es entrain de te faire mousser parce que ton machine mets 0.2s au lieu de 0.1s). Ce n'est ni la faute à gcc, ni par ignorance du flag magic. -O2 est très bien. Cherche dans ton code, profiler à l'appuie.
 
Mouarf, j'avais pas lu le détail sur 'niveau de la taille de l'executable, de la bouffe de memoire lors de l'execution'.
 
Sérieusement, ça sert à rien de changer tes flags de compilation ou de sur-pourir ton code.

Reply

Marsh Posté le 27-05-2007 à 11:38:31    

kaiser52 a écrit :


" gcc -I. -W -Wall -pedantic -ansi -O3 -g3 -Wstrict-prototypes -S -fsigned-bitefields -fno_default_inline -p -Winline -mcpu=i386 "


Ah ouais, tu sais ce que tu fais. -I. chapeau. -g3 et -p du code optimisé avec les infos de debug, c'est pour optimiser la taille de l'exécutable je suppose. -O3 aussi apparemment. -S c'est pour sortir l'assembleur ... -fsigned-bitefields n'existe pas. -fno_default_inline non plus. -mcpu=i386 est soit la valeur par défaut te gcc voire une valeure plus contraignante permettant moins d'optimisation. Beau travail

Reply

Marsh Posté le 27-05-2007 à 12:18:24    

Citation :

Ah ouais, tu sais ce que tu fais. -I. chapeau. -g3 et -p du code optimisé avec les infos de debug, c'est pour optimiser la taille de l'exécutable je suppose. -O3 aussi apparemment. -S c'est pour sortir l'assembleur ... -fsigned-bitefields n'existe pas. -fno_default_inline non plus. -mcpu=i386 est soit la valeur par défaut te gcc voire une valeure plus contraignante permettant moins d'optimisation. Beau travail


 
Hola du calmes !
Je commence dans la prog donc faut etre indulgent.
Dejas :
 
-C'est un travail de groupe.
-C'est pas ma ligne de commande.
-Je ne fais pas le debug ( Donc le -g3 et tous et tous c'est pas mon probleme ).
-J'ai pas le droit de changer l'algo je doit me DEMERDER avec un algo en Bruit de Force.
-Pour -fsigned-bitfields ca existe : http://www.linux-kheops.com/doc/ma [...] gcc.1.html. Edit : CTR + F ca mange pas de pain.
 
Apres si tu peux pas comprendre j'y peu rien moi  :??:  
Apart ca.
Le code est passe de 2sec32 a 0sec42 en changeant la ligne de compilation.

Citation :

CFLAGS = -W -Wall -Werror -pedantic -ansi -Wstrict-prototypes -O1 -O3 -funroll-loops -fomit-frame-pointer -mcpu=$(MACHTYPE)


 
PS : Je comprend pas pouquoi -O3 apelle -O2 et que -O2 n'appelle pas -O1.
Edit : C'est pas facil d'aprendre a comprendre le code d'un autre, de le debugger et de l'optimiser !

Message cité 1 fois
Message édité par kaiser52 le 27-05-2007 à 12:21:44

---------------
Benchmarks du peuple - Crysis War - Vide grenier ! - nVIDIA Tegra
Reply

Marsh Posté le 27-05-2007 à 12:58:21    


 
Oui, et non pas *bite*fields.
 

Citation :

PS : Je comprend pas pouquoi -O3 apelle -O2 et que -O2 n'appelle pas -O1.


Qu'est-ce qui te fais croire ça ? Et Qu'est-ce qui t'empêches de consulter la documentation à ce sujet ?
 

Reply

Marsh Posté le 27-05-2007 à 17:29:57    

Citation :

Oui, et non pas *bite*fields.


 
Mais c'est pas de ma faute si mon partenaire ne sait pas recopier . Si ?
C'est mon groupe donc je leur fais confiance... C'est un crime ?
 
On m'a demande de poste pour avoir des reponses a des question, et c'est tous se que je recole...
Merci, vraiment Merci.
 

Citation :

Qu'est-ce qui te fais croire ça ? Et Qu'est-ce qui t'empêches de consulter la documentation à ce sujet ?


 
J'ai consulte la documentation.
Je sais que -O avec -O1 active certaines choses.
Puis j'ai retire le -mcpu=XXX, on aura pas de testes sur des ancienes machines.
Et je suis oblige d'utiliser le GCC du systeme, le binaire de la version 4.1.2 n'est pas compatible Sun et Alpha.
 
La derniere version revient a ca :
 

Citation :

CFLAGS = -W -Wall -Werror -pedantic -ansi -Wstrict-prototypes -Winline -O -O1 -O3 -funroll-loops -fomit-frame-pointer -finline-functions

Message cité 1 fois
Message édité par kaiser52 le 27-05-2007 à 17:30:44

---------------
Benchmarks du peuple - Crysis War - Vide grenier ! - nVIDIA Tegra
Reply

Marsh Posté le 27-05-2007 à 17:29:57   

Reply

Marsh Posté le 27-05-2007 à 17:33:00    

kaiser52 a écrit :

Le code est optimiser à fond, pas de malloc inutiles etc (Char à la palce de Int etc ...)


C'est quoi le "etc" ?
T'as calculé la complexité de ton code, ainsi que la complexité optimale pour ce genre de problème ?
 
Bref: as-tu la preuve que ton algo est *le* plus rapide ?
Parce qu'étrangement, les gens se soucient avant de O3 et après de leur code ...


---------------
Töp of the plöp
Reply

Marsh Posté le 27-05-2007 à 17:49:55    

Citation :

C'est quoi le "etc" ?
T'as calculé la complexité de ton code, ainsi que la complexité optimale pour ce genre de problème ?
 
Bref: as-tu la preuve que ton algo est *le* plus rapide ?
Parce qu'étrangement, les gens se soucient avant de O3 et après de leur code ...


 
Comme je l'ai dis plus haut, je dois faire avec se que l'on me donne.
Donc l'algo c'est pas mon probleme.
Le but c'est surtout d'aprendre a comprendre un Code qui ne m'apartient pas et de bien utiliser GCC.


---------------
Benchmarks du peuple - Crysis War - Vide grenier ! - nVIDIA Tegra
Reply

Marsh Posté le 27-05-2007 à 18:05:55    

kaiser52 a écrit :

Citation :

C'est quoi le "etc" ?
T'as calculé la complexité de ton code, ainsi que la complexité optimale pour ce genre de problème ?
 
Bref: as-tu la preuve que ton algo est *le* plus rapide ?
Parce qu'étrangement, les gens se soucient avant de O3 et après de leur code ...


 
Comme je l'ai dis plus haut, je dois faire avec se que l'on me donne.
Donc l'algo c'est pas mon probleme.
Le but c'est surtout d'aprendre a comprendre un Code qui ne m'apartient pas et de bien utiliser GCC.


 

Spoiler :

http://tbn0.google.com/images?q=tbn:3asKsbLfoS7H6M:mypomme.free.fr/photonet/bescherelle.jpg


---------------
Töp of the plöp
Reply

Marsh Posté le 27-05-2007 à 18:26:34    

okay.
 
Tu penses que ca va faire avancer le sujet ?

Message cité 1 fois
Message édité par kaiser52 le 27-05-2007 à 18:32:40

---------------
Benchmarks du peuple - Crysis War - Vide grenier ! - nVIDIA Tegra
Reply

Marsh Posté le 27-05-2007 à 18:55:12    

kaiser52 a écrit :

Citation :

Oui, et non pas *bite*fields.


 
Mais c'est pas de ma faute si mon partenaire ne sait pas recopier . Si ?
C'est mon groupe donc je leur fais confiance... C'est un crime ?


 
C'était sans importance, et je me contrefout de la cause.
 

Citation :

On m'a demande de poste pour avoir des reponses a des question, et c'est tous se que je recole...
Merci, vraiment Merci.


J'ai passé 5 minutes à te répondre, et je le regrette. Pour ma part, j'ai fini de te répondre.
 
 

Reply

Marsh Posté le 27-05-2007 à 18:55:57    

kaiser52 a écrit :

okay.
 
Tu penses que ca va faire avancer le sujet ?


C'est une marque de respect envers les gens qui te lisent. C'est donc primordial.


---------------
Töp of the plöp
Reply

Marsh Posté le 27-05-2007 à 18:57:55    

_darkalt3_ a écrit :

Bref: as-tu la preuve que ton algo est *le* plus rapide ?
Parce qu'étrangement, les gens se soucient avant de O3 et après de leur code ...


 
C'est aussi ma façon de faire. C'est bien plus facile de régler un problème avec des flags de compilation, que de repenser un algorithme.

Reply

Marsh Posté le 27-05-2007 à 19:05:45    

++fab a écrit :

C'est aussi ma façon de faire. C'est bien plus facile de régler un problème avec des flags de compilation, que de repenser un algorithme.


Je dirais qu'on a plus de chances en général de voir un programme s'executer plus rapidement en optimisant l'algo que le compilo; j'ai pas été très loin dans les options de compilation, mais j'ai déjà eu des vitesse d'execution décuplée en optimisant boucles, tests ou affectations. Des options de compilations permettent un tel ratio ?


---------------
Töp of the plöp
Reply

Marsh Posté le 27-05-2007 à 19:07:47    

Citation :

C'est une marque de respect envers les gens qui te lisent. C'est donc primordial.


 
Et se que tu as fais c'est pas un manque de respect de ta part ?
Encore j'aurais écrit en langage SMS je veux bien.
Mais la c'est du grand n'importe quoi, le but c'est de se faire comprendre, et le faite de mettre que 1 seul P à la place de 2 ne va pas changer la façon dont ton cerveau va l'interpréter à part si tu es autistes.
 
Enfin le sujet n'est pas là.
 
edit :
 

Citation :

Je dirais qu'on a plus de chances en général de voir un programme s'executer plus rapidement en optimisant l'algo que le compilo; j'ai pas été très loin dans les options de compilation, mais j'ai déjà eu des vitesse d'execution décuplée en optimisant boucles, tests ou affectations. Des options de compilations permettent un tel ratio ?


 
J'ai pas vraiment fais de gros programmes à part un Raytracer mais sans optimisations à la compilation.
Mais sur se projet, je suis quand même passé de 2sec32 à 0sec42. Il est possible qu'avec des optimisations de boucle et à la compilation tu puisses perdre le double de temps d'exécution.
 
edit : Becherel ou pas ?  :kaola:

Message cité 1 fois
Message édité par kaiser52 le 27-05-2007 à 19:18:39

---------------
Benchmarks du peuple - Crysis War - Vide grenier ! - nVIDIA Tegra
Reply

Marsh Posté le 27-05-2007 à 19:15:29    

kaiser52 a écrit :

Et se qua tu as fais c'est pas un manque de respect de ta part ?


Pardon ?

 
kaiser52 a écrit :

Encore j'aurais écrit en langage SMS je veux bien. Mais la c'est du grand n'importe quoi, le but c'est de se faire comprendre,


Exactement, et le français est le bon outil pour ça.

 
kaiser52 a écrit :

et le faite de mettre que 1 seul P à la place de 2 ne va pas changer la façon dont ton cerveau va l'interpréter à part si tu es autistes.


N'importe quoi.

 
kaiser52 a écrit :

Enfin le sujet n'est pas là.


Si, aussi.


Message édité par _darkalt3_ le 27-05-2007 à 19:16:23

---------------
Töp of the plöp
Reply

Marsh Posté le 27-05-2007 à 19:29:20    

Tu vois, moi j'essaye de discuter avec des gens et de trouver des solutions à des problèmes.
Et ne vas pas me dire que tu essayes de trouver des solutions à mes problèmes d'orthographes.
Si tu n'as jamais fais de fautes d'orthographes dans ta vie c'est génial pour toi. J'ai écrit ca en vitesse.
J'aime bien la communauté HFR, mais là.... enfin bon.
Mais si tu viens pas ici pour faire avancer le sujet, je t'invite à sortir.


---------------
Benchmarks du peuple - Crysis War - Vide grenier ! - nVIDIA Tegra
Reply

Marsh Posté le 27-05-2007 à 19:59:27    

T'inquiètes, je réponds pas aux mecs qui n'ont pas de respect pour leurs lecteurs.


---------------
Töp of the plöp
Reply

Marsh Posté le 28-05-2007 à 08:33:21    

"Bruit de Force", t'es sûr ?

Reply

Marsh Posté le 28-05-2007 à 08:41:01    

Reply

Marsh Posté le 28-05-2007 à 09:24:18    

Citation :

"Bruit de Force", t'es sûr ?


 
Oui, enfin c'est comme ca qu'ils appellent cette technique.
Ca consiste a piler / dépiler etc....., la Méthode Barbar...
 

Citation :

Cadeau:
 
http://www.onlamp.com/pub/a/onlamp [...] eters.html


 
Merci, je vais lire ca de très près.


---------------
Benchmarks du peuple - Crysis War - Vide grenier ! - nVIDIA Tegra
Reply

Marsh Posté le 28-05-2007 à 09:48:17    

"Brute force" alors, pas "bruit de force".

Reply

Marsh Posté le 28-05-2007 à 10:01:38    

Citation :

"Brute force" alors, pas "bruit de force".


 
Ok.
La prochaine fois je leur demanderais d'articuler, et en même temps j'irais me racheter des oreilles.  :pt1cable:


---------------
Benchmarks du peuple - Crysis War - Vide grenier ! - nVIDIA Tegra
Reply

Marsh Posté le 28-05-2007 à 14:56:21    

matafan a écrit :

"Brute force" alors, pas "bruit de force".


Merci d'avoir relever ça, ça permet mieux percevoir le contexte.
C'est quoi l'optimisation "bruit de force" ?


Message édité par Taz le 28-05-2007 à 14:57:12
Reply

Marsh Posté le 28-05-2007 à 18:28:06    

kaiser52 a écrit :

Citation :

kaiser >> ton code n'est pas assez rapide? as-tu essaye de le profiler pour voir ce qui prenait du temps?


 
En faite le but c'est de faire un programme qui resoud des sudoku ( Pour l'instant le teste est fait sur 10 maps d'affile. A la fin se sera entre 100 et 1000 maps), mais le plus rapidement possible.
Notre but c'est d'optimiser un code avec Bruit de Force.
Quand je dis optimisation, c'est niveau de la taille de l'executable, de la bouffe de memoire lors de l'execution, et du temps d'execution.
 

Citation :

 Char plus rapide que int ? Vous avez fait des tests ?
Théoriquement c'est le contraire car au niveau  interne, les opérations se font au minimum sur 16 bits et quand il n'y a que 8 bits, cela oblige à un masquage. Mais de toutes manières la différence est tellement minime entre les deux que cela ne devrait pas se sentir sauf si vous faîtes du calcul vraiment intensif.
Eviter les malloc est en effet une bonne chose. Vous les remplacer par quoi ? Par des données statiques, des données sur la piles, en registres ?
Si vous postiez ici la partie de votre programme qui prend le plus de temps, il y aurait très probablement quelques personnes qui pourraient vous proposer des optimisations.


 
Le char a la place de int c'est surtout pour la bouffe lors de l'execution, mais j'ai remis les int pour l'optimisation du temps d'execution.
Apres oui les mallocs sont change par des donnees statiques.


 
Tu veux pas dire "Force Brute" (Brute Force) plutôt que "Bruit de Force" ?
Si c'est le cas, tu ferais mieux d'utiliser un meilleur algorithme plutôt que d'optimiser salement un algo dont tu sais qu'il est mauvais pour ton problème.
 
le Sudoku est un bête problème de CSP qui se résoud facilement et avec une complexité raisonnable avec un algo comme Bucket Elimination. Au pire tu peux toujours rester sur un Brute Force mais passe un pré-filtrage de ton espace des valeurs à essayer pour retirer un max de valeurs idiotes.
 

Reply

Marsh Posté le 28-05-2007 à 18:29:12    

Zut, déjà vu par d'autres ;-)

Reply

Marsh Posté le 28-05-2007 à 23:08:01    

Oui je sais on m'a déjà repris sur le " Brute Force ", maintenant je le sais  ;)  
Puis c'est bon le projet à été clos et soutenue se matin !
Merci à tous de votre aide tchao.
 
See you.
 
PS : Problème résolu avec _darkalt3_.


---------------
Benchmarks du peuple - Crysis War - Vide grenier ! - nVIDIA Tegra
Reply

Marsh Posté le 30-05-2007 à 00:49:59    

_darkalt3_ a écrit :

Je dirais qu'on a plus de chances en général de voir un programme s'executer plus rapidement en optimisant l'algo que le compilo; j'ai pas été très loin dans les options de compilation, mais j'ai déjà eu des vitesse d'execution décuplée en optimisant boucles, tests ou affectations. Des options de compilations permettent un tel ratio ?


 
Je ne connais pas d'options miracles pour les flags de compilation, mais c'est sur qu'il y a une nette différence entre une compilation avec optimisation et une compilation sans.
 
Après, j'essaye juste d'être faignant/productif ; si je peux régler un problème de performance sans mettre en péril mes tests de non régression, je ne vais pas m'en priver. Et j'observe qu'il y a d'avantage de risque en touchant au code qu'aux options du compilateur -- pour peu qu'on sache à peu près ce que l'on touche.

Reply

Marsh Posté le    

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed