<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 14 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:Consolas;
        panose-1:2 11 6 9 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p
        {mso-style-priority:99;
        mso-margin-top-alt:auto;
        margin-right:0in;
        mso-margin-bottom-alt:auto;
        margin-left:0in;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
pre
        {mso-style-priority:99;
        mso-style-link:"HTML Preformatted Char";
        margin:0in;
        margin-bottom:.0001pt;
        font-size:10.0pt;
        font-family:"Courier New";}
p.MsoAcetate, li.MsoAcetate, div.MsoAcetate
        {mso-style-priority:99;
        mso-style-link:"Balloon Text Char";
        margin:0in;
        margin-bottom:.0001pt;
        font-size:8.0pt;
        font-family:"Tahoma","sans-serif";}
span.HTMLPreformattedChar
        {mso-style-name:"HTML Preformatted Char";
        mso-style-priority:99;
        mso-style-link:"HTML Preformatted";
        font-family:Consolas;}
span.BalloonTextChar
        {mso-style-name:"Balloon Text Char";
        mso-style-priority:99;
        mso-style-link:"Balloon Text";
        font-family:"Tahoma","sans-serif";}
span.EmailStyle22
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="blue" vlink="purple">
<div class="WordSection1">
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">Hi Trish and Eamonn:<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">Thank you very much for the clarifications. In fact, the spelling checking function that Manhong suggested in an earlier is very much like the search function
 that Trish described. This is indeed a different issue and a two-step function suggested by Nigam makes sense.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">I do now know the underlying algorithm for the Bioportal search function. Manhong’s spelling check is based on string similarity rather than pronunciation similarity
 that many web-based auto filling functions rely on. As a result, Manhong’s spelling check can deal with strings containing numbers and other characters (e.g., chemical compound name) much better.
<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">Best,<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">Fan<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"><o:p> </o:p></span></p>
<div>
<div style="border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in">
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Tahoma","sans-serif"">From:</span></b><span style="font-size:10.0pt;font-family:"Tahoma","sans-serif""> Trish Whetzel [mailto:whetzel@stanford.edu]
<br>
<b>Sent:</b> Friday, December 14, 2012 11:38 AM<br>
<b>To:</b> Eamonn Maguire<br>
<b>Cc:</b> Meng, Fan; ISA Team; Dai, Manhong; support@bioontology.org Support<br>
<b>Subject:</b> Re: [ISAtools] RE: [bioontology-support] Annotator query<o:p></o:p></span></p>
</div>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<p class="MsoNormal">Hi Eamonn, <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">I chatted with Nigam the other day about this and it was a design decision to have the Annotator recognize strings exactly as they are specified in the ontology, therefore an annotation problem. Where as partial string matching is a search
 problem and generally folks are used to seeing more than 1 result returned from a search versus having an exact match as the result of annotation. In this case, the methods being developed by the UMich folks may not be the appropriate solution but I wanted
 to loop them into the discussion in an attempt to collect additional use cases as relevant for their work. In general, when I work with research groups and they encounter this issue I suggest that text not matched to an ontology term via the Annotator be sent
 to the search web service to see if there are any partial matches. Nigam also suggested that this "two-step" feature may be able to be implemented as a parameter in the web service. However, any partial matches from search would need to be clearly flagged
 as such and these results most likely would need more human review to select an appropriate matching ontology term. <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">Trish <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<div>
<p class="MsoNormal">On Dec 14, 2012, at 4:41 AM, Eamonn Maguire wrote:<o:p></o:p></p>
</div>
<p class="MsoNormal"><br>
<br>
<o:p></o:p></p>
<div>
<p class="MsoNormal">Hi all, <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">So, I'm a bit more informed about how the algorithm works, however adding synonyms to me doesn't sound like a full solution to the issue. To me, making "hay fever" a synonym of "hay" or vice versa is incorrect. Similarly, "compound treatment
 design" is not the same as "compound treatment", I'm sure that some of the ontologists out there would have a fit of some sort if ontologies were to have such generalisations just for this use-case. <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">The issue here is that between BioPortal and the Annotator, you'd expect the same  behaviour. So BioPortal works on partial string matches, whereas the Annotator does not.  The inconsistency is confusing our users. <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">If this was solved, and the content in Annotator and BioPortal search was more harmonised, we'd be very grateful and are privy to giving out hugs. <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">Eamonn<o:p></o:p></p>
</div>
<div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<table class="MsoNormalTable" border="0" cellspacing="0" cellpadding="0" style="z-index:auto">
<tbody>
<tr>
<td style="padding:0in 0in 0in 0in">
<div>
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Arial","sans-serif"">--</span></b><span style="font-size:11.0pt;font-family:"Calibri","sans-serif""><o:p></o:p></span></p>
</div>
<div>
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Arial","sans-serif"">Eamonn Maguire</span></b><span style="font-size:10.0pt;font-family:"Arial","sans-serif""><br>
</span><span style="font-size:8.5pt;font-family:"Arial","sans-serif"">Oxford e-Research Centre & Computer Science Department</span><span style="font-size:11.0pt;font-family:"Calibri","sans-serif""><o:p></o:p></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:8.5pt;font-family:"Arial","sans-serif"">University of Oxford</span><span style="font-size:11.0pt;font-family:"Calibri","sans-serif""><o:p></o:p></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif""><o:p> </o:p></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:8.0pt;font-family:"Arial","sans-serif"">7 Keble Road, Oxford, OX1 3QG</span><span style="font-size:11.0pt;font-family:"Calibri","sans-serif""><o:p></o:p></span></p>
</div>
<div>
<p class="MsoNormal"><b><span style="font-size:8.0pt;font-family:"Arial","sans-serif"">T:</span></b><span style="font-size:8.0pt;font-family:"Arial","sans-serif""> 01865 (2) 610788 <b>M:</b> 07526 924483</span><span style="font-size:11.0pt;font-family:"Calibri","sans-serif""><o:p></o:p></span></p>
</div>
</td>
</tr>
</tbody>
</table>
</div>
<p><span style="color:#A0A0A8">On Thursday, 13 December 2012 at 19:14, Meng, Fan wrote:<o:p></o:p></span></p>
<blockquote style="border:none;border-left:solid windowtext 1.0pt;padding:0in 0in 0in 8.0pt;margin-left:0in;margin-top:5.0pt;margin-bottom:5.0pt">
<div>
<div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">Hi all:</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">I completely agree with Ray’s explanations. If a word or phrase is part of a concept but itself is not defined as a synonym of the concept or a different concepts,
  Annotator will not identify that word or phrase as a match.  The only correct way for Annotator to find “compound treatment” is to define it as a synonym to “compound treatment design” in the ontology or define it as a new concept.</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">While we can modify the program to do partial match and to indicate the full concept string associated with the partial match, the result will likely be very
 messy.  In the example we discussed, “compound treatment”, “treatment design”, “compound”, “treatment”, “design” can be different concepts as well as be associated with many different concepts. Even if we limit the length of the partial phrase to be at least
 two words, “compound treatment” and  “treatment design” in this example are likely represent different concepts.</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">Best,</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">Fan</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<div style="border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in">
<div>
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Tahoma","sans-serif"">From:</span></b><span style="font-size:10.0pt;font-family:"Tahoma","sans-serif""> Ray Fergerson [<a href="mailto:ray.fergerson@stanford.edu">mailto:ray.fergerson@stanford.edu</a>]
<br>
<b>Sent:</b> Thursday, December 13, 2012 1:56 PM<br>
<b>To:</b> 'Susanna-Assunta Sansone'<br>
<b>Cc:</b> <a href="mailto:isatools@googlegroups.com">isatools@googlegroups.com</a>; Meng, Fan; 'Eamonn Maguire'; 'Trish Whetzel'; Dai, Manhong;
<a href="mailto:support@bioontology.org">support@bioontology.org</a><br>
<b>Subject:</b> RE: [ISAtools] RE: [bioontology-support] Annotator query</span><o:p></o:p></p>
</div>
</div>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">Susanna,</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">I think that my example text was too short to get the idea across.  Here is the situation. The ontology contains two distinct concepts (1) “treatment” and (2)
 “compound treatment design”. For the purposes of this discussion, assume that neither term has any synonyms. The user passes in to the Annotator some free text such as:
</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">“The patient was given a compound treatment: first we did treatment X and then we did treatment Y”.</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">The question which the Annotator is trying to answer is which concepts from the ontology are present in this free text. The current answer, and I believe the
 correct answer, is that the concept “treatment” appears three times and the concept “compound treatment design” does not appear at all. The Annotator only does a string comparison to extract concept names and synonyms and the string “compound treatment design”
 does not appear in the text. The annotator is not doing a “starts with” match. It is an exact match only.</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">The only way that the free text above is going to produce an annotator match to the “compound treatment design” concept is for this concept to have  a synonym
 that appears exactly in the free text.   </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">Ray</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<div style="border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in">
<div>
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Tahoma","sans-serif"">From:</span></b><span style="font-size:10.0pt;font-family:"Tahoma","sans-serif""> Susanna-Assunta Sansone [<a href="mailto:sa.sansone@gmail.com">mailto:sa.sansone@gmail.com</a>]
<br>
<b>Sent:</b> Thursday, December 13, 2012 4:16 AM<br>
<b>To:</b> Ray Fergerson<br>
<b>Cc:</b> <a href="mailto:isatools@googlegroups.com">isatools@googlegroups.com</a>; 'Meng, Fan'; 'Eamonn Maguire'; 'Trish Whetzel'; 'Dai, Manhong';
<a href="mailto:support@bioontology.org">support@bioontology.org</a><br>
<b>Subject:</b> Re: [ISAtools] RE: [bioontology-support] Annotator query</span><o:p></o:p></p>
</div>
</div>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<div>
<p class="MsoNormal">Hi Ray,<o:p></o:p></p>
</div>
<pre style="margin-left:.5in"> <o:p></o:p></pre>
<pre style="margin-left:.5in">--<o:p></o:p></pre>
<div>
<p class="MsoNormal">On 12/12/2012 21:55, Ray Fergerson wrote:<o:p></o:p></p>
</div>
</div>
<blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">Eamonn,</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">In OBI there are two terms “treatment” and “compound treatment design”. If the text that you supply is “compound treatment” then this results in a match on
 the first term but not the second.</span><o:p></o:p></p>
</div>
</blockquote>
<div>
<p class="MsoNormal"><br>
I do not get this sorry. If what you say below (about the term has to be a synonym to be found) is the case, then I do not believe that  “compound treatment” is a  synonym of "treatment" that is why this is found and  “compound treatment design” is not.<br>
If the Annotator is supposed to suggest terms you have to be able to find both “treatment” and “compound treatment design” and then you leave the user to choose which one is more relevant to their context.<br>
<br>
My two cents,<br>
Susanna<br>
<br>
<br>
<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">This seems reasonable and it is difficult to see how it could work differently. If the ontology contained the term “hay fever” and you supplied the text “hay”
 I don’t think that you should expect a match. The annotator is not a search system, it is a term matching system. “hay” is not the same term as “hay fever”.</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">If “compound treatment” were a declared synonym of “compound treatment design” then it should be found. If it is really a synonym (unclear to me) but not declared
 to be one in the ontology that you are using then you could consider extending the ontology or contacting the authors and asking them to add a synonym.</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">Ray</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><br>
<br>
<br>
<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<div style="border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in">
<div>
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Tahoma","sans-serif"">From:</span></b><span style="font-size:10.0pt;font-family:"Tahoma","sans-serif"">
<a href="mailto:bioontology-support-bounces@lists.stanford.edu">bioontology-support-bounces@lists.stanford.edu</a> [<a href="mailto:bioontology-support-bounces@lists.stanford.edu">mailto:bioontology-support-bounces@lists.stanford.edu</a>]
<b>On Behalf Of </b>Meng, Fan<br>
<b>Sent:</b> Wednesday, December 12, 2012 12:49 PM<br>
<b>To:</b> Eamonn Maguire; Trish Whetzel; Dai, Manhong<br>
<b>Cc:</b> ISA Team; <a href="mailto:support@bioontology.org">support@bioontology.org</a> Support<br>
<b>Subject:</b> Re: [bioontology-support] Annotator query</span><o:p></o:p></p>
</div>
</div>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial","sans-serif"">Hi Eamonn and Trish:</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial","sans-serif""> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial","sans-serif"">Thanks a lot for  your messages. If the terms “"compound treatment" and"compound treatment design" are both in an ontology, I believe mgrep will only give the longest match
 by default but list both terms as matches will be possible.</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial","sans-serif"">However, mgrep will not find them if none of them are in the ontologies you selected.
</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial","sans-serif""> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial","sans-serif"">Manhong wrote the mgrep program and I believe it is possible to include that option although we may need to generate more complex dictionaries. Manhong can certainly provide
 better insights on this issue.</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial","sans-serif""> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial","sans-serif"">Best,</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial","sans-serif""> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial","sans-serif"">Fan</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Tahoma","sans-serif"">From:</span></b><span style="font-size:10.0pt;font-family:"Tahoma","sans-serif""> Eamonn Maguire [<a href="mailto:eamonnmag@gmail.com">mailto:eamonnmag@gmail.com</a>]
<br>
<b>Sent:</b> Wednesday, December 12, 2012 12:48 PM<br>
<b>To:</b> Trish Whetzel<br>
<b>Cc:</b> Meng, Fan; <a href="mailto:support@bioontology.org">support@bioontology.org</a> Support; ISA Team<br>
<b>Subject:</b> Re: [bioontology-support] Annotator query</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<div>
<p class="MsoNormal">Hi Trish, <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">Thanks for your reply. It would be great if this feature were integrated in to the annotator. Some users have been asking us why the annotator doesn't find things they expect it to, so it's good to have a response to this. I understand
 why you do it the way you do but I'd assume that an indexing system such as Lucene could help improve the speed for these types of lookups.<o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">Thanks again,<o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">Eamonn<o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<table class="MsoNormalTable" border="0" cellspacing="0" cellpadding="0" style="margin-left:1.0in;z-index:auto">
<tbody>
<tr>
<td style="padding:0in 0in 0in 0in">
<div>
<div>
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Arial","sans-serif"">--</span></b><o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Arial","sans-serif"">Eamonn Maguire</span></b><span style="font-size:10.0pt;font-family:"Arial","sans-serif""><br>
</span><span style="font-size:8.5pt;font-family:"Arial","sans-serif"">Oxford e-Research Centre & Computer Science Department</span><o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:8.5pt;font-family:"Arial","sans-serif"">University of Oxford</span><o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif""> </span><o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:8.0pt;font-family:"Arial","sans-serif"">7 Keble Road, Oxford, OX1 3QG</span><o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"><b><span style="font-size:8.0pt;font-family:"Arial","sans-serif"">T:</span></b><span style="font-size:8.0pt;font-family:"Arial","sans-serif""> 01865 (2) 610788 <b>M:</b> 07526 924483</span><o:p></o:p></p>
</div>
</div>
</td>
</tr>
</tbody>
</table>
</div>
<p style="margin-left:1.0in"><span style="color:#A0A0A8">On Wednesday, 12 December 2012 at 17:45, Trish Whetzel wrote:</span><o:p></o:p></p>
<blockquote style="border:none;border-left:solid windowtext 1.0pt;padding:0in 0in 0in 8.0pt;margin-left:0in;margin-top:5.0pt;margin-bottom:5.0pt">
<div>
<div>
<div>
<div>
<p class="MsoNormal">Hi Eamonn, <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">I am not aware of any parameters that can be altered with the Annotator to get a match based on the scenario below. The dictionary that the Annotator uses is based on the preferred names and synonyms of ontology terms and there has to be
 an exact match in the input text to the dictionary term to return a match .. good for speed of annotation but does not handle term variations in the matching step unless the variation is included in the ontology itself.<o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">Last I talked with the developers of the entity recognizer that the Annotator uses, called Mgrep, they have developed some methods to account for term permutations and there was an interest to collect use cases to test further. I have included
 Fan Meng in this response in case this is of interest to pursue further.<o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">Best,<o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">Trish <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<div>
<div>
<p class="MsoNormal">On Dec 12, 2012, at 4:17 AM, Eamonn Maguire wrote:<o:p></o:p></p>
</div>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<div>
<div>
<p class="MsoNormal">Hi all, <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">I have a query about the annotator. <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">It appears that if we search on something like "compound treatment", we don't get a hit for "compound treatment design" for instance from OBI/EFO. Do you have any idea about how we can get the search results to return a better match? Or
 if it's possible?<o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">Many thanks,<o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">Eamonn<o:p></o:p></p>
</div>
</div>
<div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<table class="MsoNormalTable" border="0" cellspacing="0" cellpadding="0" style="margin-left:1.0in;z-index:auto">
<tbody>
<tr>
<td style="padding:0in 0in 0in 0in">
<div>
<div>
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Arial","sans-serif"">--</span></b><o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Arial","sans-serif"">Eamonn Maguire</span></b><span style="font-size:10.0pt;font-family:"Arial","sans-serif""><br>
</span><span style="font-size:8.5pt;font-family:"Arial","sans-serif"">Oxford e-Research Centre & Computer Science Department</span><o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:8.5pt;font-family:"Arial","sans-serif"">University of Oxford</span><o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif""> </span><o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:8.0pt;font-family:"Arial","sans-serif"">7 Keble Road, Oxford, OX1 3QG</span><o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"><b><span style="font-size:8.0pt;font-family:"Arial","sans-serif"">T:</span></b><span style="font-size:8.0pt;font-family:"Arial","sans-serif""> 01865 (2) 610788 <b>M:</b> 07526 924483</span><o:p></o:p></p>
</div>
</div>
</td>
</tr>
</tbody>
</table>
</div>
<div>
<p class="MsoNormal">_______________________________________________<br>
bioontology-support mailing list<br>
<a href="mailto:bioontology-support@lists.stanford.edu">bioontology-support@lists.stanford.edu</a><br>
<a href="https://mailman.stanford.edu/mailman/listinfo/bioontology-support">https://mailman.stanford.edu/mailman/listinfo/bioontology-support</a><o:p></o:p></p>
</div>
</div>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
</div>
</blockquote>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<p class="MsoNormal">-- <br>
ISA support team:<br>
- Philippe Rocca-Serra<br>
- Eamonn Maguire<br>
- Alejandra Gonzalez-Beltran<br>
- Susanna-Assunta Sansone<br>
***<br>
<a href="http://www.isa-tools.org/">www.isa-tools.org</a><br>
<a href="http://www.isacommons.org/">www.isacommons.org</a><br>
 <br>
 <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
</body>
</html>