<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
Hello,
<div class=""><br class="">
</div>
<div class="">I confess to not having a complete understanding of all the nuances of the annotator, so I'm afraid I can't fully satisfy your request for a detailed explanation.  If you have not done so already, I suggest you search the previous questions about
 the annotator in our Nabble repo of support emails (<a href="http://ncbo-support.2288202.n4.nabble.com/" class="">http://ncbo-support.2288202.n4.nabble.com/</a>).
<div class=""><br class="">
</div>
<div class="">It seems to me that '6-10', '11-15', and '1-5' all pass as tokens >= 3 characters; '6' and '> 15' do not ('> 15' is 2 tokens separated by a space, and each token is 1 or 2 characters).</div>
<div class=""><br class="">
</div>
<div class="">I can't speak to the details of the second set of strings. we'll see if anyone else in the team or on this list can speak to them.</div>
<div class=""><br class="">
</div>
<div class="">You may wish to read the top publications on the Annotator, so that you can understand its detailed operations more thoroughly. I found a useful list at <a href="https://scholar.google.com/scholar?hl=en&as_sdt=0,5&q=BioPortal+annotator" class="">https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=BioPortal+annotator</a>,
 most of these are openly available. In particular, the Annotator+ documented in <a href="https://academic.oup.com/bioinformatics/article/34/11/1962/4802221?login=true" class="">https://academic.oup.com/bioinformatics/article/34/11/1962/4802221?login=true</a> may
 have additional features that are useful to you.</div>
<div class=""><br class="">
</div>
<div class="">I'm most sorry that I can't give you an in-depth and precise response right away, the tools were developed before my time. But I have contacted a primary author of the annotation software to see if he can add to this response. </div>
<div class=""><br class="">
</div>
<div class="">John<br class="">
<div><br class="">
<blockquote type="cite" class="">
<div class="">On Mar 17, 2021, at 6:42 PM, Zhou, Shuxin <<a href="mailto:sz23@njit.edu" class="">sz23@njit.edu</a>> wrote:</div>
<br class="Apple-interchange-newline">
<div class="">
<div dir="ltr" class="">Hi Mr.Graybeal,
<div class=""><br class="">
<div class="">Thank you for the quick response! I do appreciate it very much!</div>
<div class="">In addition to the issue, we tried some other concepts which are included in the RCIT_A1 ontology as well. </div>
<div class="">The problem is: </div>
<div class="">(1). For the classes ending with "L/min", 3 out of 6 are annotated out. Why half of them can be annotated, but the rest cannot?</div>
<div class="">(2). For concepts like: "3 days ago", "3 days later", "three days ago" ( which is the synonym of "3 days ago") are not successfully recognized, but wrongly annotated by another class "3 days".</div>
<div class="">      Since they are 3-character concepts, they should meet with the indexing rule you mentioned.</div>
<div class=""><br class="">
</div>
<div class="">I apologize for disturbing you again, but our team needs to know the reason for such annotation results, then we can continue our research on the basis of that.   </div>
<div class="">Again, thank you very much for the help!</div>
<div class=""><span id="cid:ii_kme6o7qt0"><Screen Shot 2021-03-17 at 9.14.18 PM.png></span><br class="">
</div>
<div class=""><span id="cid:ii_kme6qd3i4"><Screen Shot 2021-03-17 at 9.18.30 PM.png></span><br class="">
</div>
<div class=""><br class="">
</div>
</div>
</div>
<br class="">
<div class="gmail_quote">
<div dir="ltr" class="gmail_attr">On Wed, Mar 17, 2021 at 8:25 PM John Graybeal <<a href="mailto:jgraybeal@stanford.edu" target="_blank" class="">jgraybeal@stanford.edu</a>> wrote:<br class="">
</div>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;border-left-color:rgb(204,204,204);padding-left:1ex">
<div style="word-wrap:break-word;line-break:after-white-space" class="">hello Erica,
<div class=""><br class="">
</div>
<div class="">I am not 100% sure of the source of the problem, but I have written up the ticket <a href="https://github.com/ncbo/bioportal-project/issues/206" target="_blank" class="">https://github.com/ncbo/bioportal-project/issues/206</a> about it.</div>
<div class=""><br class="">
</div>
<div class="">As the ticket suggests, I suspect this is a function of BioPortal not indexing words shorter than 3 characters, including numbers. (If this is true, then Segment 6 works only by accident, it's the first term beginning with 'segment' *and* it matches.)
 BioPortal won't index those shorter words because they are so likely to be matched elsewhere. Though certainly the full label should be indexed, that's something we could verify if we had resources.</div>
<div class=""><br class="">
</div>
<div class="">Unfortunately we are unlikely to be able to fix it right now, as we have extraordinarily limited staff time. I am sorry I can't provide a more helpful answer at this point.</div>
<div class=""><br class="">
</div>
<div class="">John<br class="">
<div class=""><br class="">
<blockquote type="cite" class="">
<div class="">On Mar 16, 2021, at 5:00 PM, Zhou, Shuxin <<a href="mailto:sz23@njit.edu" target="_blank" class="">sz23@njit.edu</a>> wrote:</div>
<br class="">
<div class="">
<div dir="ltr" class="">Dear BioPortal Technical Team,
<div class="">This is Erica Zhou, and I met some problems with using the BioPortal annotator page.</div>
<div class="">I uploaded a private ontology <b class="">RCIT_A1</b> a few days ago, and some concepts(classes) were not successfully referred to when I tried to annotate certain text. </div>
<div class=""><br class="">
</div>
<div class=""><b class="">For example, I have a text containing "segment 7", "segment 6", and "segment 4A", and they are all included in RCIT_A1.</b></div>
<div class=""><span id="gmail-m_5431371062028043144gmail-m_7318593444941498136cid:ii_kmco8eq30" class=""><Screen Shot 2021-03-16 at 7.52.28 PM.png></span><br class="">
</div>
<div class=""><br class="">
</div>
<div class=""><b class="">But only "segment 6" is recognized as below, but "segment 7" and "segment 4A" are not correctly annotated out, instead, they are annotated partially to "Segment".</b></div>
<span id="gmail-m_5431371062028043144gmail-m_7318593444941498136cid:ii_kmcoc0ci2" class=""><Screen Shot 2021-03-16 at 7.55.42 PM.png></span>
<div class=""><br class="">
<div class="">So, could you help me fix this issue? I would appreciate it very much!</div>
<div class=""><br class="">
</div>
<div class="">Best regards</div>
<div class="">Shuxin(Erica) Zhou<br class="">
<div class="">
<div class=""><br class="">
</div>
-- <br class="">
<div dir="ltr" class="">
<div dir="ltr" class="">
<table style="font-size:16px;border-collapse:collapse;width:525px;border-spacing:0px;background-color:transparent;color:rgb(35,38,54);font-family:Poppins,sans-serif" class="">
<tbody style="border:0px;padding:0px;font-size:0.9em" class="">
<tr class="">
<td style="padding:5px;font-size:0.9em;font-stretch:normal;line-height:1.5;color:rgb(255,0,0);border-width:0px 3px 0px 0px;border-right-style:solid;border-right-color:rgb(204,0,0);width:180px;vertical-align:middle" class="">
<a href="https://www.njit.edu/" style="background-color:transparent;text-decoration:none;color:rgb(51,122,183)" target="_blank" class=""><img src="https://assets.njit.edu/uicomponents/NJIT-email-logo.png" alt="NJIT logo" style="border: 0px; display: block; vertical-align: middle; width: 150px; height: auto; max-width: 150px;" class=""></a></td>
<td style="padding:5px 5px 5px 10px;font-size:12px;font-stretch:normal;line-height:16px;color:rgb(111,111,111);border:0px;font-family:Arial,Helvetica,sans-serif" class="">
<strong style="font-size:13px" class="">Shuxin Zhou</strong><br class="">
Phd Student of SABOC Lab<br class="">
<br class="">
<a href="mailto:sz23@njit.edu" style="background-color:transparent;text-decoration:none;color:rgb(204,0,0)" target="_blank" class="">sz23@njit.edu</a> </td>
</tr>
</tbody>
</table>
</div>
</div>
</div>
</div>
</div>
</div>
_______________________________________________<br class="">
bioontology-support mailing list<br class="">
<a href="mailto:bioontology-support@lists.stanford.edu" target="_blank" class="">bioontology-support@lists.stanford.edu</a><br class="">
<a href="https://mailman.stanford.edu/mailman/listinfo/bioontology-support" target="_blank" class="">https://mailman.stanford.edu/mailman/listinfo/bioontology-support</a><br class="">
</div>
</blockquote>
</div>
<br class="">
<div class="">
<div style="letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; word-wrap: break-word; line-break: after-white-space;" class="">
<div style="letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; word-wrap: break-word; line-break: after-white-space;" class="">
<div style="letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; word-wrap: break-word; line-break: after-white-space;" class="">
<div style="letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; word-wrap: break-word; line-break: after-white-space;" class="">
<div style="letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; word-wrap: break-word; line-break: after-white-space;" class="">
<div style="letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; word-wrap: break-word; line-break: after-white-space;" class="">
<div style="letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; word-wrap: break-word; line-break: after-white-space;" class="">
========================
<div class="">John Graybeal</div>
<div class="">Technical Program Manager</div>
<div class="">Center for Expanded Data Annotation and Retrieval /+/ NCBO BioPortal</div>
<div class="">Stanford Center for Biomedical Informatics Research<br class="">
650-736-1632  | ORCID  0000-0001-6875-5360</div>
<div class=""><br class="">
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
<br class="">
</div>
<br class="">
</div>
</div>
</blockquote>
</div>
</div>
</blockquote>
</div>
<br class="">
<div class="">
<div style="color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
<div style="color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
<div style="color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
<div style="color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
<div style="color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
<div style="color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
<div style="color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
========================
<div class="">John Graybeal</div>
<div class="">Technical Program Manager</div>
<div class="">Center for Expanded Data Annotation and Retrieval /+/ NCBO BioPortal</div>
<div class="">Stanford Center for Biomedical Informatics Research<br class="">
650-736-1632  | ORCID  0000-0001-6875-5360</div>
<div class=""><br class="">
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
<br class="Apple-interchange-newline">
</div>
<br class="">
</div>
</div>
</body>
</html>