Gamekyo : Blog : [HS JV] Recherche logiciel AI "deepfake" spécifique

lock2 > blog

[HS JV] Recherche logiciel AI "deepfake" spécifique

Montage Vidéo

Bonjour à toute la communauté,
Ce que je vais demander, je ne sais même pas si ça existe: J'ai besoin d'un LOGICIEL (et non-pas d'une IA qui travail en ligne) orienté IA sur un plan "créatif/artistique visuel".

L'idée: je me suis fais filmer sous différents angles sur des séquences entre 10 à 15 secondes chacune où je simule à chaque fois la même chose. C'est à dire qu'on me voit (quelques soient les types d'angles) debout entrain de surélever légèrement mes deux avant bras avec les mains ouvertes, et où je fais mine d'imiter des chœurs avec ma bouche, le tout avec un mouvement de la tête qui "regarde vers le ciel" dans l'idée; bien que le tout a été filmé dans le salon d'un appartement.

Pour les besoin du passage d'un mix que j'ai fait il y un bout de temps, je vais avoir nécessité d'avoir recours à l'IA pour que dans les 1:35 de temps de chœurs, je puisse ressembler à n'importe quelles ethnies (ou "races" si vous préférez) que peut constituer notre humanité. Mais attention sur ce point, je ne veux pas du "Deepfake de base" même si c'est réaliste (et ça doit l'être d'ailleurs !) car je ne souhaite pas seulement changer la couleur de peau, de cheveux et de type de visage qui doit changer, mais également la façon dont je suis habillé.

Par exemple j'aimerai pouvoir transférer quelques unes de mes vidéos pour en faire une vidéo définitive (video to video quoi) où au rendu je puisse ressembler en tout point à un hindou d'Indes, tant au niveau du type de visage que de l'accoutrement. Pour faire la transition entre les deux qu'importe que ce soit à coût de prompt ou d'une image illustratrice d'un indien d'Indes tant que le résultat est réaliste. Il faut savoir que devrait répéter autant de fois la même opération pour représenter un maximum d'ethnies dans le monde; le tout pour mener à bien tout un montage video à faire sur ce mix qui doit comporter au cumule - et pour rappel - tout de même 1 minute et 35 secondes d'IA.

Je tiens à trouver cela sous forme d'une licence payante (j'imagine... vue l'ampleur du truc) par le biais d'un logiciel compatible Windows 11, et non pas comme je le disais plus haut sous forme de plateformes sur des sites d'IA (sauf si c'est gratuit dans ce cas de figure).

Peut-être que faire un tel pseudo-deepfake en mode video vers video, avec un rendu probant et réaliste et en plus par le biais d'un véritable software PC, c'est peut-être un peu trop demandé, mais dans le cas où un tel logiciel pouvant subvenir à mes besoins existerait pour de vrai, j'ai rien contre pour connaître son nom au moins, voir me donner aussi quelques précisions.

Merci par avance et au plaisir de vous lire

PS: ceci n'est pas un débat sur l'IA. Merci de votre compréhension.

tags :

Who likes this ?

posted the 03/10/2026 at 11:00 AM by lock2

comments (7)

micheljackson posted the 03/10/2026 at 11:21 AM

Bah demande à chatgpt.

lock2 posted the 03/10/2026 at 11:27 AM

Micheljackson La bonne blague... remarque j'ai quand-même sourie. Comme quoi.

Bon, quelqu'un d'autre susceptible de m'orienter ?

micheljackson posted the 03/10/2026 at 12:09 PM

lock2
ce n'est pas une blague, je viens de c/c ton pavé à chatgpt, et il te donne la solution en détails.

lock2 posted the 03/10/2026 at 12:31 PM

Micheljackson Autant pour moi alors

Si je pensais que c'était pour vanner (gentillement), c'est parce que je n'imaginais pas que le level des IA typé demande/discussion telle que chatgpt avaient faits de tels progrès pour décrypter "un pavé" (comme tu dis), avec qui plus est une grammaire générale un peu à la ramasse quand-même.

Est-ce que tu aurais la gratitude de me faire un copier/coller de la procédure que t'as donné chatgpt stp ?
Je sais que tu vas me dire que je peux m'y prendre moi-même, et tu aurais raison. Mais depuis une sale histoire à l'ancienne avec Siri sur un iPhone 8 à l'ancienne qui m'a juste sorti des trucs flippants (trop long à expliquer); ben depuis je me méfie de "causer" à des IA.
Après, rien ne t'y oblige. Si tu le souhaites pas je comprendrais.

micheljackson posted the 03/10/2026 at 12:40 PM

lock2
Oui — ce que tu décris existe, mais il faut être clair : aujourd’hui ce type de résultat se fait plutôt avec une combinaison d’outils IA locaux, pas avec un seul logiciel magique. La bonne nouvelle : avec ton GPU (tu as mentionné une RTX 5080 dans une autre discussion), tu as exactement le type de machine nécessaire pour ça.

Je vais te montrer les solutions réalistes en 2026, en privilégiant les logiciels locaux Windows.

1️⃣ La solution la plus puissante (et 100 % locale)
Stable Diffusion + ComfyUI

C’est actuellement la méthode la plus utilisée dans le milieu créatif.

???? Principe :

tu importes ta vidéo

elle est découpée en images

l’IA redessine chaque image avec un nouveau visage, vêtements, style

la vidéo est reconstruite

On appelle ça video-to-video diffusion.

Ce que tu peux modifier

Avec les bons modèles :

ethnie / morphologie du visage

vêtements

coiffure

environnement

style artistique ou photoréaliste

Donc exactement ce que tu veux :
toi → hindou indien → africain → asiatique → etc.

Les modules à utiliser

Dans ComfyUI on utilise généralement :

AnimateDiff → cohérence vidéo

ControlNet → garder ta pose et tes mouvements

IPAdapter / FaceID → garder certaines caractéristiques

Roop / Reactor → remplacement de visage réaliste

Résultat :
la vidéo garde tes gestes exacts, mais l’apparence change complètement.

Avantages

✔ fonctionne 100 % hors ligne
✔ gratuit
✔ ultra-réaliste
✔ contrôle total via prompts ou images

Inconvénients

⚠ installation technique
⚠ nécessite GPU puissant (mais tu l’as)

2️⃣ Une solution spécialisée Deepfake vidéo
DeepFaceLab

C’est le logiciel deepfake historique.

Fonctionne localement sur Windows.

Mais limite importante

Il fait surtout :

remplacement de visage

et pas vraiment :

changement de corps

vêtements

ethnie complète

Donc dans ton cas ce serait insuffisant seul.

3️⃣ Une solution plus simple (mais semi-automatique)
Wonder Studio

Logiciel IA orienté cinéma.

Il permet :

remplacer une personne par un personnage

modifier l’apparence

Mais :

⚠ il dépend du cloud
⚠ moins flexible

Donc pas idéal pour ton besoin précis.

4️⃣ Pipeline réaliste pour ton projet (ce que font les créateurs)

Voici le workflow typique :

1️⃣ découper la vidéo

avec :

FFmpeg

ou DaVinci Resolve

2️⃣ transformation IA

avec :

ComfyUI

modèle Stable Diffusion réaliste

Prompt exemple :

indian hindu man, traditional kurta, realistic skin, cinematic lighting

ou avec image de référence.

3️⃣ reconstruction vidéo

réassembler les frames.

5️⃣ Le rendu que tu peux attendre

Avec les bons modèles :

✔ changement complet d’ethnie
✔ vêtements traditionnels
✔ rendu cinéma
✔ cohérence entre les frames

Les clips de 1m35 sont totalement faisables.

6️⃣ Le point critique : la cohérence vidéo

Le vrai problème est :

éviter que le visage change à chaque frame

Les solutions :

AnimateDiff

TemporalNet

Face consistency models

Et là ComfyUI est le meilleur.

7️⃣ Temps de rendu estimé (avec RTX 5080)

Pour 1m35 à 24 fps :

≈ 2300 frames.

En IA diffusion :

⚡ environ 1 à 3 heures de rendu.

8️⃣ Si tu veux un résultat vraiment ciné

Les créateurs utilisent aussi :

Topaz Video AI

pour :

stabiliser

augmenter la résolution

améliorer les visages.

???? Conclusion

La solution qui correspond exactement à ton projet est :

???? Stable Diffusion + ComfyUI (local)

car c’est le seul système qui permet :

video-to-video

changement complet d’apparence

contrôle artistique total

fonctionnement hors ligne

???? Si tu veux, je peux aussi te montrer :

le workflow précis pour transformer une personne en différentes ethnies dans une vidéo

les modèles IA réalistes à télécharger

un exemple de pipeline ComfyUI pour ton cas précis

(et honnêtement, c’est assez bluffant ce qu’on peut faire aujourd’hui).

benichou posted the 03/10/2026 at 12:57 PM

Réponse de mon Chatgpt

« Donc ton projet :

Tu te filmes dans ton salon, les bras levés, en train de faire “aaaaaah” comme un chœur céleste imaginaire, et ton plan c’est que l’IA transforme ça en tour du monde ethnique version PowerPoint mystique pendant 1 minute 35.

En gros tu veux que la technologie la plus avancée du moment serve à transformer
“un mec qui mime dans son salon”
en
“manifestation audiovisuelle de l’humanité entière”.

C’est ambitieux.
C’est un peu comme si quelqu’un disait :

“J’ai enregistré mon chien qui aboie… quelqu’un connaît un logiciel pour en faire la 9e symphonie de Beethoven ?”

(oui, celle de Ludwig van Beethoven, pas celle de ton voisin qui tape sur un mur).

⸻

Le moment que j’adore dans ton texte, c’est la précision quasi administrative :

“Je souhaite une licence payante compatible Windows 11.”

Oui bien sûr.
Parce que les ingénieurs qui ont développé les pipelines VFX de Industrial Light & Magic attendaient justement quelqu’un qui voulait se transformer successivement en toutes les ethnies du monde en levant les bras dans un salon.

Ils vont probablement sortir ça dans la prochaine mise à jour :

Ethnicity Orchestra Generator v2.3

⸻

Et ton exigence est magnifique :
• deepfake crédible
• transformation morphologique complète
• vêtements adaptés culturellement
• transitions propres
• vidéo cohérente
• logiciel PC offline
• résultat réaliste

Donc en résumé tu cherches un logiciel qui fait :

casting + maquillage + costumes + morphing + VFX + montage + direction artistique

mais sous forme de bouton :

“Make me the entire humanity please.”

⸻

Et j’imagine la vidéo finale :

Plan 1 : toi qui lèves les bras.
Plan 2 : toi indien.
Plan 3 : toi japonais.
Plan 4 : toi masaï.
Plan 5 : toi inuit.
Plan 6 : toujours toi… mais avec des filtres culturels.

Ce sera littéralement :

“L’humanité selon… Kevin dans son salon.”

Un concept anthropologique fascinant.

⸻

Mais attention, le meilleur moment reste celui-ci :

“Peut-être que c’est un peu trop demandé…”

Ah bon ?
Tu crois ?

Non non, c’est raisonnable.
La prochaine étape logique c’est :

“Sinon quelqu’un connaît un logiciel Windows pour générer directement un film de Christopher Nolan à partir d’un selfie ?” »

lock2 posted the 03/10/2026 at 01:17 PM

Micheljackson Merci tu m'es d'une grande utilité. J'ai tout lu, pas forcément tous pigé notamment pour la première solution qui est en toute vraie semblance la meilleur façon de procéder dans mon cas à défaut d'être un logiciel "magique" ou tout-en-un si j'ai bien compris.
Je vais relire les autres possibilités plus simples mise à part Topaz Video que je connais déjà qui fait ni plus ni moins (mais de très haut niveau dans son genre) de l'upscale frame par frame de vidéos de sortes à tout recrées dans des définitions (et même plus...) plus haute avec un résultat bluffant pour le peu que l'on sache bien l'utiliser, surtout sur les dernières versions devenus sophistiqué. Pour ta part, chatgpt t'as sorti naturellement ta carte graphique. Pour ma part je carbure sur une RTX4080 Super. Et de toute façon je comptais pas faire un rendu entier de 1:35m pour chaque ethnie. Mais plusieurs plans (2 à 3 maximum) plutôt cours pour chaque ethnie. Donc disons: en moyenne 10s pour une ethnie = un projet et un rendu distinct des autres. Après je me débrouillerai comme un grand pour incruster chaque ethnie dans un cadre du monde qui lui est propre dans mon logiciel de montage video: Magix Vegas Pro 22. Et du coup une fois "toutes" les ethnies significatives réuni ça fera bien: 1 minutes 35 secondes