Bibm@th

Forum de mathématiques - Bibm@th.net

Bienvenue dans les forums du site BibM@th, des forums où on dit Bonjour (Bonsoir), Merci, S'il vous plaît...

Vous n'êtes pas identifié(e).

Répondre

Veuillez composer votre message et l'envoyer
Nom (obligatoire)

E-mail (obligatoire)

Message (obligatoire)

Programme anti-spam : Afin de lutter contre le spam, nous vous demandons de bien vouloir répondre à la question suivante. Après inscription sur le site, vous n'aurez plus à répondre à ces questions.

Quel est le résultat de l'opération suivante (donner le résultat en chiffres)?
quarantedeux plus cinq
Système anti-bot

Faites glisser le curseur de gauche à droite pour activer le bouton de confirmation.

Attention : Vous devez activer Javascript dans votre navigateur pour utiliser le système anti-bot.

Retour

Résumé de la discussion (messages les plus récents en premier)

evil77
24-05-2022 08:51:25

Bonjour Fred

La question qui est derrière le besoin de précision est celle du cout de l'expérience menée. Si on doit séquencer 1080 fois les ADNs au lieu de 50, le cout de l'expérience s'envole (x20) et le méthode par mélange d'ADNs perd de sa pertinence pratique. Même avec 145 ce n'est plus "rentable" alors que le test expérimental donne "environ 50". Je vais me contenter de la valeur moyenne (qui "colle" avec l'observation) ou choisir un seuil de P pas trop ambitieux.

Merci en tout cas pour vos contributions . J'ai appris pleins de choses!
:)

Eric

Fred
23-05-2022 19:45:06

Bonsoir,

  Je ne veux pas paraître lourd, mais procéder pour ce problème à partir d'un dénombrement sans vouloir utiliser les inégalités de Markov ou de Bienaymé-Tchebychev, c'est renier 300 ans de progrès en probabilité!
Je peux proposer un problème un peu similaire (plus facile) : j'ai un échantillon de 100000 pièces dont 30 000 proviennent de l'usine A et 70 000 de l'usine B. Je prélève 1000 pièces au hasard. Quelle est la probabilité que moins de 250 pièces prélèvées proviennent de l'usine A? Personne qui connait un peu la probabilité ne fera ceci un dénombrement utilisant la loi binomiale, pour la bonne raison que les calculs sont complètement impossibles, même avec un ordinateur et le meilleur des logiciels de calcul. En revanche, si on utilise l'inégalité de Bienaymé-Tchebychev, on trouve une approximation de cette probabilité (mieux, une minoration) qui suffit dans la plupart des cas.

Evil77, tu dis t'attendre à quelque chose pas très éloigné de 50. Je ne suis pas étonné du tout : l'espérance de $T_n$ est $16H_{16}$, et ça vaut à peu près 54. Cela signifie qu'il faut en moyenne 54 tirages pour avoir un ADN provenant des 16 origines. Et ce que dit l'inégalité de Markov, c'est qu'avec 54/(1-p) tirages, tu as une probabilité >=p d'avoir un ADN provenant des 16 origines (par exemple, si p=0.95, il faut environ 1080 tirages).
N'est-ce pas exactement ce type d'estimation que tu voulais (ou alors ai-je mal compris la question)?
Bien sûr, le 1080 n'est pas optimal, mais est-ce vraiment nécessaire de connaître la plus petite valeur?
Et je suis sûr qu'on peut beaucoup améliorer le 1080 si nécessaire grâce à l'inégalité de Bienaymé-Tchebychev - un petit calcul à la main, qui demande à être vérifié, me dit qu'il suffirait de 145 tirages.

A+
F.

evil77
23-05-2022 17:23:42

Bonsoir
En effet , super lourd;)
J'ai essayé avec un petit nombre et je me perds déjà!
L'autre problème c'est que N est vraiment grand (disons 10exp7! , probablement plus compte tenu du mode d'obtention). N'y a t il pas une version de ce crible qui fonctionne avec remise, avec des probabilités fixes de chaque couleur?
Mais peut etre est ce déjà le cas!?

eric

Tof
23-05-2022 16:57:44

Bonsoir,

Pour vous faire la main ( au sens de fixer p -- comme  0.95 ou 0.99 --  pour en déduire la valeur de t en principe unique) vous pouvez par exemple prendre 4 couleurs, au lieu de 16, N = 13 cartes  , ce qui revient à vous demander ( quitte à vous aider d'un calculateur formel ou procéder par tâtonnements ) de combien de cartes t devrait être constituée une main tirée au hasard sans remise parmi 52  afin de ne pas avoir de chicane avec la probabilité p (un peu de pique, un peu de cœur, un peu de carreau, un peu de trèfle donc).
Evidemment c'est fictif , car si t < 13 pour les 4 joueurs il reste une pioche mais bon...
Il restera à transposer avec 16 et un  N très grand de vôtre choix, mais déjà avec des paramètres plus petits cela peut vous donner une idée de manipulation ( lourd j'en conviens ).

Bon courage

Tof

evil77
23-05-2022 10:03:46

Bonjour Fred

J'attends une valeur plus proche de 50 je dirais, mais l'expérience contrôle qui permet cette évaluation porte sur peu d'ADNs et donc pas facile de répondre précisément.

Je vais essayer la méthode de Tof (si j'y parviens,)!!

merci
eric

Fred
20-05-2022 21:59:50

Re-

  J'avais fait une erreur de signe mais déjà juste avant. Je viens de corriger le post, mais le résultat final était correct.

Tu dis que le facteur 16 t'éloigne de l'observation expérimentale, mais il ne faut pas oublier que ce que je donne n'est pas la meilleure valeur possible du nombre de tirages, mais une valeur qui fonctionne. L'inégalité de Markov est très grossière. Si j'utilise l'inégalité de Bienaymé-Tchebychev, je vais trouver une valeur meilleure (= plus petite) - mais qui sera sans doute plus grande que ce que tu trouves expérimentalement.
A quelle valeur t'attends-tu?

F.

evil77
20-05-2022 16:58:01

Bonsoir

J'ai regardé la demo sur l'espérance. Je comprends le principe mais pas encore tout. Surtout ce facteur 16 m'éloigne de l'observation expérimentale...

Je crois y voir une erreur de signe (!?) : calcul de P(Z=q) lors de la factorisation de ((k-1)/n)^q-1
le facteur est -1+ (k-1)/n

A^q - A^(q-1) = A x A^(q-1) - A^(q-1) = (A-1)(A^(q-1))


J'ai du me tromper!

Fred
20-05-2022 13:24:12

Bonjour,

  D'abord 1000 excuses, je me suis trompé pour l'espérance de $T_n$, ce n'est pas $H_n$ mais $nH_n$. En particulier, la valeur de $k$ que je t'ai donné dans un post précédent doit encore être multipliée par $16$.


Je vais essayer de t'expliquer comment faire pour calculer cette espérance. Pour $k\geq 2$, on note $Z_k=T_k-T_{k-1}$.
$Z_k$ correspond donc au temps (= au nombre de tirages supplémentaires) qu'il faut pour passer de $k-1$ ADN différents obtenus à $k$ ADN différents.

Le point clé est de remarquer que $P(Z_k>q)$ vaut $\left(\frac{(k-1)}{n}\right)^q$. En effet, l'événement $Z_k>q$ correspond à dire que, une fois obtenus les $k-1$ ADN différents, les $q$ tirages suivants amènent tous un ADN parmi ceux-déja choisis. Comme il y a $n$ ADN différents, il y a à chaque tirage une probabilité $(k-1)/n$ de tirer un ADN déjà choisi, et les tirages sont indépendants (ici, on fait l'hypothèse qu'il y a tellement de séquences d'ADN dans lesquelles tu choisis que les tirages déjà effectués ne changent pas l'équirépartition). Ainsi, $P(Z_k>q)=\left(\frac{k-1}n\right)^q$. On en déduit que

$$P(Z_k=q)=P(Z_k>q-1)-P(Z_k>q)=\left(\frac{k-1}n\right)^{q-1}-\left(\frac{k-1}n\right)^{q}=\left(1-\frac{k-1}n\right)\left(\frac{k-1}n\right)^{q-1}.$$

Ceci signifie que $Z_k$ suit une loi géométrique de paramètre $1-\frac{k-1}n=\frac{n-k+1}n$.

Or, on a une formule pour l'espérance de la loi géométrique. Ici, on trouve $E(Z_k)=\frac{n}{n-k+1}$.

On retourne alors à $T_n$ comme suit : puisque $Z_1=T_1$, $Z_2=T_2-T_1$, $Z_3=T_3-T_2$, ..., en sommant ces égalités, on trouve
$Z_1+\cdots+Z_n=T_n$. On en déduit que
$$E(T_n)=E(Z_1)+\cdots+E(Z_n)=\frac{n}{n}+\frac{n}{n-1}+\cdots+\frac{n}{1}=nH_n.$$

F.

evil77
20-05-2022 10:32:41

Bonjour

@Fred et @Tof

Je précise donc mon problème.
Dans l'expérience de séquençage réelle, les lectures (tirages) sont simultanés. Lorsque j'ai réalisé k lectures (un seul tirage de k séquences), est ce que j'ai lu au moins une fois une séquence de chacun des 16 ADNs mélangés. En pratique est ce que j'ai l'information pour tous les donneurs d'ADNs qui ont contribué au mélange?
Comme le propose Fred, si je peux dire qu'avec k lectures j'ai une estimation conservative de la probabilité P d'avoir cet événement, cela me convient. Je fais quelques lectures de trop mais ce n'est pas bien grave (la solution de Tof doit pouvoir évaluer ce "quelques lectures de trop" en comparant les résultats des deux approches (?))

@Fred . Pour la partie Hn= 1+ 1/2 ... 1/16,  je ne comprend pas le raisonnement: espérance du premier tirage =1, OK! pour les suivants, je ne vois pas

Merci  à vous
Eric

Tof
20-05-2022 08:01:12

Bonjour,


@Fred : ta proposition de solution convient à merveille si Evil77 proposait le contexte des évènements en ces termes, ce qui ne saute pas aux yeux, et donc à mon sens demande à être clarifié au plan de l'expérience aléatoire, je n'ai donc pas dit que c'était faux évidemment. C'est une belle solution si le contexte est bien celui-là.
En quelque sorte tu proposes la modélisation (donc son contexte) conjointement à sa solution.
C'est plutôt à Evil77 de la préciser (en plus je ne connais rien à la biologie ni aux expériences subséquentes).

Il y a deux façons de voir l'univers et donc les probabilités qui vont avec dans ce que propose Evil77.
Après tout dans les exercices de probabilités avec les urnes et les boules, ceux où on pioche simultanément les yeux bandés, en pleine nuit sans lune et dans un tunnel non éclairé t boules parmi 16N correspondent à l'autre angle de vue :-).

@Evil77 : oui les + et les - alternent depuis le premier terme ( à cause de la formule d'inclusion-exclusion ou "crible de Poincaré" ), la relation à exactement la même structure ( si opération sans remise ) que celle du fil de Tony_Levalois.
Avec remise les coefficients binomiaux multiplicateurs restent pareils, il faut juste remplacer les autres ( choix de parties ) en choix d'applications.


[nota bene] à un répunit près,  Evil66 ça enfonce le clou :-)

Tof

yoshi
19-05-2022 20:19:59

Bonsoir,

Désolé j'ai pas d'éditeur de math  ... ou je ne sais pas m'en servir !

Juste un "truc" universel : le Code LaTex
Ça tombe bien, ci-dessus un lien vers un tuto court qui t'en donne le principe et la "philosophie"...

En 1/4 h à 20 min grand maximum, tu peux déjà te débrouiller avec.

@+

Fred
19-05-2022 20:13:32

Bonsoir,

  D'abord, je ne suis pas tout à fait d'accord avec ce que Tof dit.
La modélisation que je propose convient au problème. Si je sais que $P(T_n\leq k)\geq p$,
il suffit que je fasse $k$ tirages pour avoir obtenu les $n$ couleurs. Je peux très bien les avoir obtenus avant d'avoir réalisé les $k$ tirages,
mais au moins je sais que si j'ai fait $k$ tirages, alors j'ai une probabilité supérieure ou égale à $p$ d'avoir eu les $n$ couleurs.

  Ensuite, il est très rare dans ce type de problèmes de faire des calculs exacts de probabilité. On peut bien trouver une formule, certes, ainsi que Tof le propose, mais elle est extrêmement difficile à utiliser : déjà les coefficients binomiaux peuvent être difficiles à calculer numériquement, et il est de plus très difficile de résoudre l'équation que l'on obtient. Ainsi, pour répondre à ce genre de problèmes, les probabilistes utilisent des minorations ou des majorations de probabilités, via des inégalités comme l'inégalité de Markov ou de Tchebychev, ou alors des approximations via par exemple le théorème central limite. C'est ainsi que l'on résout de nombreux problèmes liés aux tirages (ou plus généralement à la loi binomiale), comme par exemple celui de la surréservation.

  Les inégalités de Markov et de Tchebychev permettent de quantifier la probabilité qu'une variable aléatoire s'écarte de sa moyenne. Par exemple, si je lance une pièce de monnaie équilibrée 1000 fois, il est peu vraisemblable que j'obtienne moins de 300 fois pile. On peut calculer cette probabilité par une formule explicite, comme le propose Tof, mais qui est très difficile à calculer, ou bien en donnant une majoration qui est bien suffisante dans la pratique.

  Dans le cas qui t'intéresse, on a vu que l'espérance de $T_n$ est $H_n=1+\frac 12+\cdots+\frac 1n$. Ce qui veut dire qu'il faut en moyenne $H_{16}$ tirages pour obtenir toutes les couleurs. Mais bien sûr, il y a des cas où on fera les $H_{16}$ tirages et où on n'obtiendra pas toutes les couleurs. L'inégalité de Markov permet de savoir quelle est la probabilité qu'il faille plus de $k$ tirages. Elle dit en effet que
$$P(T_n\geq k)\leq \frac{E(X_n)}{k}.$$
Toi, tu veux qu'il ne faille pas plus de $k$ tirages pour avoir toutes les couleurs, avec probabilité $p$. Il suffit donc que $\frac{E(T_n)}{k}\leq 1-p$, ou encore que
$$k\geq \frac{E(T_n)}{1-p}.$$
Puisque $E(T_{16})=H_{16}\simeq 3,\!38$, il suffit de faire $k\geq \frac{3,\!38}{1-p}$ tirages pour avoir les $n$ couleurs avec probabilité supérieure ou égale à $p$.

  Ce n'est pas la meilleure valeur possible pour $k$. Mais elle fonctionne à coup sûr! Pour obtenir quelque chose de meilleur, il faudrait appliquer l'inégalité de Tchebychev et s'intéresser à la variance de $T_n$. Je peux te guider vers cela comme t'apporter des éclaicissements supplémentaires si nécessaires.

F.

PS : Ah, si les biologistes pouvaient se mettre à utiliser LaTeX pour écrire des mathématiques!

evil77
19-05-2022 19:07:36

bonsoir
Vous me proposez donc d'appliquer la formule E= Cnm + Somme des i entre i et k-1 [(-1)^i x Cik x Cm(n-i)m] (Désolé j'ai pas d'éditeur de math  ... ou je ne sais pas m'en servir!) ?  Pas si évident pour moi d'identifier les variables à remplacer.
Sinon, je compte effectivement fixer p (0.95 ou 0.99 probablement) dans ma présentation des résultats.

merci encore
eric

yoshi
19-05-2022 16:16:12

Bonjour,

Plusieurs remarques :
1. Ton sujet n'a rien à voir avec le sujet en cours, il parasite la discussion couverte par Evil77.
    Il est de règle, dans tout forum, de respecter cette consigne : un sujet = une discussion, ce n'est donc pas ton cas.
2. Pour déposer ton sujet, tu as dû forcément soit cliquer sur Répondre, soit écrire directement dans le cadre Réponse rapide.
    Or, ton texte ne constitue en rien une réponse à Evil77, alors pourquoi ? Méconnaissance du sens du verbe Répondre ?
    J'en serais quand même surpris. Et pourtant...
3. C'est bien de produire un énoncé "propre", encore faudrait-il que tu nous dises ce que toi tu as déjà fait.
    Ici, on t'aidera, mais on ne fera pas le travail à ta place...

En conséquence, je te demande d'ouvrir ta propre discussion en cliquant sur ce lien : Nouvelle discussion,  choisir un titre court et précis, puis de copier/coller ton sujet, sans oublier de nous faire part de ton avancement...
Tu as 48 h pour le faire après quoi je supprimerai mon message et le tien.
En attendant, je veillerai à ce que tu n'aies pas de réponse : j'en suis désolé pour toi, mais je ne peux pas agir autrement sauf à accepter que l'anarchie s'installe dans ce forum.

Merci de ta compréhension.

       Yoshi
- Modérateur -

[EDIT] Plutôt niveau Lycée ce sujet, du moins  chez nous. Dans ce cas, autre lien à cliquer : Nouvelle discussion (cet intitulé  est le même dans chaque page de chacun des 10 sous-forums différents mais ouvre une nouvelle discussion dans le sous-forum considéré)

yoann
19-05-2022 12:45:28

Bonjour

Exercice 1. On tire simultanément, au hasard, 5 cartes dans un jeu de 32 cartes.
On suppose les tirages équiprobables.
1. Quel est le nombre total d’issues ?
2. Calculer la probabilité de:
(a) l’´évènement A : tirer exactement 2 cœurs (c’est-`a-dire 2 cœurs, et 2 seulement, dans
les 5 cartes tirées) ?
(b) l’´événement B : tirer exactement 2 cœurs et aucun as.
(c) l’´évènement C : tirer au moins 1 as.
(d) l’´évènement E : tirer exactement deux rois ou aucun as.

Pied de page des forums