content: Add spaces behind each node to reduce gap with plain text

2025-11-07 15:14:15 +07:00 · 2025-11-07 15:14:15 +07:00 · 2172603ad5
commit 2172603ad5
parent c91ab96642
1 changed files with 2 additions and 2 deletions
--- a/pkg/analyzer/content.go
+++ b/pkg/analyzer/content.go
@ -627,7 +627,7 @@ func (c *ContentAnalyzer) extractTextFromHTML(htmlContent string) string {
 	var extract func(*html.Node)
 	extract = func(n *html.Node) {
 		if n.Type == html.TextNode {
-			text.WriteString(n.Data)
+			text.WriteString(" " + n.Data)
 		}
 		// Skip script and style tags
 		if n.Type == html.ElementNode && (n.Data == "script" || n.Data == "style") {
@ -639,7 +639,7 @@ func (c *ContentAnalyzer) extractTextFromHTML(htmlContent string) string {
 	}
 	extract(doc)
-	return text.String()
+	return strings.TrimSpace(text.String())
 }
 // calculateTextPlainConsistency compares plain text and HTML versions