<HTML><HEAD>
<META charset=US-ASCII http-equiv=Content-Type content="text/html; charset=US-ASCII">
<META content="MSHTML 6.00.2800.1400" name=GENERATOR></HEAD>
<BODY style="FONT-SIZE: 10pt; FONT-FAMILY: Arial; BACKGROUND-COLOR: #ffffff">
<DIV>
<DIV>In a message dated 2/16/2004 4:42:24 PM Eastern Standard Time, jblake@informatics.jax.org writes:</DIV>
<BLOCKQUOTE style="PADDING-LEFT: 5px; MARGIN-LEFT: 5px; BORDER-LEFT: blue 2px solid"><FONT face=Arial>Hi Stan,<BR><BR>I think David illustrates well that biological knowledge is the <BR>accumulation of experimental information that allows a 'judgement' ;  there <BR>is not a 'necessary and sufficient' component of a GO term association that <BR>would be easy to define, I think. The evidence codes provide a method of <BR>'summary statement' of the evidence used in standardized way that allows <BR>users a 'confidence' assessment in a way. The citation provides the <BR>researcher access to the information about the experimental procedures <BR>used, etc.</FONT></BLOCKQUOTE></DIV>
<DIV>Judy,</DIV>
<DIV> </DIV>
<DIV>What I was after was a general recipe for testing predicted GO assignments. So the</DIV>
<DIV>evidence for known GO assignments doesn't really help. David's criteria are more</DIV>
<DIV>on target, but they are quite complex, and fundamentally genetic. They suggest (to me)</DIV>
<DIV>the following N&S conditions:</DIV>
<DIV> </DIV>
<DIV>    gene G gets biological process term T iff</DIV>
<DIV>    there exists a homo/heterozygous loss/gain-of-function mutant for G, </DIV>
<DIV>                      a genetic background</DIV>
<DIV>               and an environment </DIV>
<DIV>    that together show a perturbed T which is not attributable to some other process U </DIV>
<DIV>    which is causally upstream from T but not "part-of" T,</DIV>
<DIV>    and which is not evident in the same genetic background and environment with </DIV>
<DIV>    the wild-type G.</DIV>
<DIV> </DIV>
<DIV>(I am trying to make the definition handle lethals and pathway redundancy correctly. Both cause problems -- lethals because they affect everything, yet we don't say they are involved in all processes, and redundant pathway steps because they may not have a pheno in wild type, yet we still may say they are involved in some processes. So the "which is not attributable to" is for lethals, and the "in some genetic background" is for redundants.)</DIV>
<DIV> </DIV>
<DIV>To use this definition for experimental design would seem to require:</DIV>
<DIV> </DIV>
<DIV>    1. ability to generate KO / OEX constructs for any gene of interest</DIV>
<DIV>    2. screens/phenotypes for any process T, sensitive to "direct effects" on T only</DIV>
<DIV>    3. a potentially unlimited set of background genotypes (to detect interactions) and </DIV>
<DIV>      environmental conditions</DIV>
<DIV> </DIV>
<DIV>1&2 is not inconceivable given high-throughput screens that have been developed.</DIV>
<DIV>3 is much more problematic. Part of the beauty of the "module networks" paper</DIV>
<DIV>was that (2) was always microarrays, and (3) was specified by the</DIV>
<DIV>automatically generated hypotheses. </DIV>
<DIV> </DIV>
<DIV>David's criteria make sense, but I am somewhat surprised at how "genetic" they are --</DIV>
<DIV>not that it is surprising that David would propose genetic criteria, but rather that</DIV>
<DIV>purely phenotypic criteria are used to associate a gene with a biological processes.</DIV>
<DIV>I always thought part of the goal of GO was to move away from describing</DIV>
<DIV>things in terms of mutant phenos to associating genes with normal biological</DIV>
<DIV>processes, but maybe that's just a terminological shift. Does this mean that </DIV>
<DIV>there is (in a given species) always a clear mapping between phenos and BPs?</DIV>
<DIV> </DIV>
<DIV>Cheers, -Stan</DIV>
<DIV> </DIV></BODY></HTML>