Term Vector
Unter Term Vector versteht man die Aufzählung von Worten innerhalb einer Website in einer binären Form. Durch den Term Vector kann die thematische Breite der jeweiligen Webseite ermittelt werden, so lassen sich beispielsweise inhaltliche Dubletten schnell und einfach erkennen. Manche Suchmaschinen setzen solche Term Vectoren ebenfalls ein, um einerseits Dubletten zu ermitteln und andererseits um Spam zu erkennen. Der Term Vector der Suchmaschine geht dabei meist nach einem bestimmten Schema vor. Zunächst werden alle Stop Wörter entfernt. Alle Begriffe, die dann noch übrigbleiben, werden nach ihrer Häufigkeit sortiert. Durch diese Struktur kann die Suchmaschine schnell Schlüsse in Bezug auf die inhaltliche Breite einer Präsenz ziehen und gleichzeitig bietet sie die Möglichkeit Dubletten schnell zu erkennen. Die reinen deutschsprachigen Suchmaschinen nutzen die Möglichkeiten, die durch Term Vector gegeben werden, kaum, obwohl dies eine relativ einfache Ermittlungsform ist.