<br><br><div><span class="gmail_quote">On 8/10/06, <b class="gmail_sendername">Peter Saint-Andre</b> &lt;<a href="mailto:stpeter@jabber.org">stpeter@jabber.org</a>&gt; wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Scott Cotton wrote:<br>&gt;<br>&gt;<br>&gt; On 8/9/06, *Michal vorner Vaner* &lt;<a href="mailto:michal.vaner@kdemail.net">michal.vaner@kdemail.net</a><br>&gt; &lt;mailto:<a href="mailto:michal.vaner@kdemail.net">michal.vaner@kdemail.net
</a>&gt;&gt; wrote:<br>&gt;<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp; On Wed, Aug 09, 2006 at 08:34:28PM +0200, Scott&nbsp;&nbsp;Cotton wrote:<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp; &gt;&nbsp;&nbsp;&nbsp;&nbsp;Hi all,<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp; &gt;<br><br>&gt;<br>&gt; I wouldn't equate removing text with ignoring it, but this is certainly
<br>&gt; sensible for embedded<br>&gt; dtds.&nbsp;&nbsp;Removing all such restricted content might lead to confusion, if<br>&gt; say a message contains non-default entity references which are standard<br>&gt; in in some common format like xhtml.&nbsp;&nbsp;These may even be crucial to the
<br>&gt; communication (like dollar sign vs. euro) Should those be silently<br>&gt; removed too?&nbsp;&nbsp;If it were up to me,&nbsp;&nbsp;I'd either&nbsp;&nbsp;pass it all through, reject<br>&gt; it all, or return a warning to the initiator to all restricted content.
</blockquote><div>[ignoring restricted xml data]<br>&nbsp;</div><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">In RFC 3920, ignore means &quot;treat it as if it did not exist&quot;. Probably we
<br>can make this clearer in rfc3921bis -- i.e., what this means both for<br>XML routers (servers) and for the stanza recipient.</blockquote><div><br>Hi,<br><br>I'm still unclear on what &quot;treat as if does not exist&quot; means.
<br>First and foremost, I don't know whether ignoring is <br>passing through untouched&nbsp; and uninterpreted or <br>removing it. <br><br>A smaller more technical issue is that some restricted content,<br>like embedded dtds, has its own structure.&nbsp; Since an implementation 
<br>is bound to accept such input (but ignore it), it has to parse it <br>in order to identify it (which hardly counts as ignoring it).&nbsp; What if<br>the restricted input doesn't actually parse according to xml 1.0?<br>Then a server returns a stream error?&nbsp;&nbsp; For example:
<br>&lt;!DOCTYPE[<br>&nbsp; &lt;jibberish&gt;<br>]&gt; <br>Since it's not a valid embedded DOCTYPE, its not restricted xml and so an implementation is not bound to accept it.&nbsp; But if it were a valid&nbsp; xml 1.0<br>embedded doctype, the implementation must accept the input (parse 
<br>it and validate that it's xml 1.0 compliant) and the implementation must ignore it.&nbsp; But by that time, the implementation can't ignore it because it already parsed it.&nbsp; <br><br>Well, enough games :)&nbsp; what is the reason for the assymetry in rfc3920?
<br>I mean why is it that everyone conforming to the protocol MUST <br>use the xml subset which is not restricted, but then again everyone MUST accept and ignore restricted xml? <br>&nbsp;  <br><br><br> </div><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Peter<br><br>--<br>Peter Saint-Andre<br>Jabber Software Foundation<br><a href="http://www.jabber.org/people/stpeter.shtml">http://www.jabber.org/people/stpeter.shtml</a><br><br><br><br></blockquote></div><br><br clear="all">
<br>-- <br>scott