TextIndexNG3 Problem: Links werden nicht indexiert
Hallo zusammen, ich hab zope 2.12.17 und möchte gerne den TextIndexNG3 nutzen. Eigentlich klappt alles prima. Aber nun fällt mir auf, daß Einträge nicht mehr angezeigt werden, die mit dem ZCTextIndex noch gefunden worden sind. Wenn ich die Catalogeinträge mit denen des ZCTextindex vergleiche, fällt mir auf, daß der TextIndexNG3 nicht alles erfasst: Beispiel: Suchbegriff 'his-hf' Eintrag ZCTextIndex: ['his', 'hf', 'logo', 'farbig', 'mit', 'text', ...] TextIndexNG3: {'PrincipiaSearchSource': [u'dtml-var', u'standardhtmlheader', u'h2dtml-var', ..... u'classsmallhis-hf', u'logo', u'farbig', u'mit', u'textbr' ...} Der TextIndexNG3 nimmt auch sämtliche HTML-und dtml-Elemente auf, was dazu führt, daß das DTML-Dokument bei Eingabe des Suchbegriffs "his-hf" nicht gefunden wird, weil er das 'Wort' 'classsmallhis-hf' indexiert hat. ich könnt jetzt natürlich mit *his-hf* suchen, aber damit würde ich ja (bei anderen Suchbegriffen) viel Mist angezeigt bekommen... Kann ich an den TextIndexNG3-Parametern noch etwas schrauben, damit auch DTML-Dokumente erfasst werden, in denen der Suchbegriff "nur" als Link vorkommt? Danke für Eure Hilfe und schöne Grüße aus Hannover, Ruth Cordes
First: stay in English Second: looks as if you are somehow indexing the unrendered DTML source code...somehow....no idea how to fix this since DTML is obsolete and because I don't care about DTML. You may take the debugger in order to figure out why unrendered DTML source code makes it into the indexer (instead of the rendered HTML). -aj Ruth Cordes wrote:
Hallo zusammen, ich hab zope 2.12.17 und möchte gerne den TextIndexNG3 nutzen. Eigentlich klappt alles prima. Aber nun fällt mir auf, daß Einträge nicht mehr angezeigt werden, die mit dem ZCTextIndex noch gefunden worden sind. Wenn ich die Catalogeinträge mit denen des ZCTextindex vergleiche, fällt mir auf, daß der TextIndexNG3 nicht alles erfasst:
Beispiel: Suchbegriff 'his-hf'
Eintrag ZCTextIndex: ['his', 'hf', 'logo', 'farbig', 'mit', 'text', ...]
TextIndexNG3: {'PrincipiaSearchSource': [u'dtml-var', u'standardhtmlheader', u'h2dtml-var', ..... u'classsmallhis-hf', u'logo', u'farbig', u'mit', u'textbr' ...}
Der TextIndexNG3 nimmt auch sämtliche HTML-und dtml-Elemente auf, was dazu führt, daß das DTML-Dokument bei Eingabe des Suchbegriffs "his-hf" nicht gefunden wird, weil er das 'Wort' 'classsmallhis-hf' indexiert hat. ich könnt jetzt natürlich mit *his-hf* suchen, aber damit würde ich ja (bei anderen Suchbegriffen) viel Mist angezeigt bekommen...
Kann ich an den TextIndexNG3-Parametern noch etwas schrauben, damit auch DTML-Dokumente erfasst werden, in denen der Suchbegriff "nur" als Link vorkommt?
Danke für Eure Hilfe und schöne Grüße aus Hannover, Ruth Cordes
_______________________________________________ Zope maillist - Zope@zope.org https://mail.zope.org/mailman/listinfo/zope ** No cross posts or HTML encoding! ** (Related lists - https://mail.zope.org/mailman/listinfo/zope-announce https://mail.zope.org/mailman/listinfo/zope-dev )
Hi Andreas, the company I work for uses zope for about 10 years. I work with it for 3 years now. Most of the code is dtml and the web-projects are quite complex so it's not trivial to change it all to lets say page-templates. So I have to live with it. Still we would like to use TextIndexNG3, in order to index pdf-files. I tried the debug-mode but I didn't get any errors. I also changed txng.splitters.simple to txng.splitters.default. This divides the pure text ('his-hf') from html ('classsmallhis-hf'). Still dtml is not rendered. Can you give any hint, where the rendering should take place (in which .py-file, that is)? It's strange that dtml is rendered correctly in ZCTextIndex. Thanks in advance! Ruth
Hi Andreas, I just tried to index a zope page template object with TextIndexNG3 and noticed that the HTML also wasn't rendered, just like it was with dtml. Strange. Perhaps there is something wrong with my zope-instance? Or could it be that the TextIndexNG3-Products I use don't go together well? It's Products.TextIndexNG3-3.4.5.1-py2.6.egg, zopyx.txng3.core-3.5.3-py2.6.egg and zopyx.txng3.ext-3.3.2-py2.6-linux-i686.egg. I also found two older versions: zopyx.textindexng3-4.0.1-py2.6-linux-i686.egg and Products.TextIndexNG3-3.4.1-py2.6.egg in the "eggs"-folder. Might that cause the trouble? Greetings, Ruth
On 05.11.2012, at 09:06, Ruth Cordes wrote:
Hi Andreas, I just tried to index a zope page template object with TextIndexNG3 and noticed that the HTML also wasn't rendered, just like it was with dtml. Strange. Perhaps there is something wrong with my zope-instance? Or could it be that the TextIndexNG3-Products I use don't go together well? It's Products.TextIndexNG3-3.4.5.1-py2.6.egg, zopyx.txng3.core-3.5.3-py2.6.egg and zopyx.txng3.ext-3.3.2-py2.6-linux-i686.egg. I also found two older versions: zopyx.textindexng3-4.0.1-py2.6-linux-i686.egg and Products.TextIndexNG3-3.4.1-py2.6.egg in the "eggs"-folder. Might that cause the trouble? Greetings, Ruth
The section "How to make your custom content-types searchable" [1] indicates you have to provide an IIndexableContent adapter for the types you want indexed (i.e. DMTLDocument). Cheers, Stefan [1] http://pypi.python.org/pypi/Products.TextIndexNG3 -- Stefan H. Holek stefan@epy.co.at
participants (3)
-
Andreas Jung -
Ruth Cordes -
Stefan H. Holek