Solr 添加文档

 

在Apache Solr Core中,我们看到了向Solr添加数据的方式,文件格式为JSON 和 .CSV。本页将说明如何使用 Apache Solr 索引中。 com/xml-tutorial">XML 文件格式。

 

示例文件

让我们使用 XML 将以下数据添加到 Solr 索引中文件格式。

Student ID First Name Phone City
001 Olivia +148022337 California
002 Emma +148022338 Hawaii
003 Sophia +148022339 Florida
004 Emily +148022330 Texas
005 Harper +148022336 Kansas
006 Scarlett +148022335 Kentucky

 

使用 XML 添加文档

为了将上述数据添加到 Solr 索引中,我们应该准备一个 XML 文档,如下所示。将以下文档保存在名为 sample.xml 的文件中。

<add> 
   <doc> 
      <field name =

"id"

>001</field> 
      <field name =

"first name"

>Olivia</field> 
            <field name =

"phone"

>+148022337</field> 
      <field name =

"city"

>California</field> 
   </doc>  
   <doc> 
      <field name = "id">002</field> 
      <field name = "first name">Emma</field> 
      <field name = "phone">+148022338</field> 
      <field name = "city">Hawai</field> 
   </doc>  
   <doc> 
      <field name = "id">003</field> 
      <field name = "first name">Sophia</field> 
            <field name = "phone">+148022339</field> 
      <field name = "city">Florida</field> 
   </doc>  
   <doc> 
      <field name = "id">004</field> 
      <field name = "first name">Emily</field> 
      <field name = "phone">+148022330</field> 
      <field name = "city">Texas</field> 
   </doc>  
   <doc> 
      <field name = "id">005</field> 
      <field name = "first name">Harper</field> 
      <field name = "phone">+148022336</field> 
      <field name = "city">Kansas</field> 
   </doc> 
   <doc> 
      <field name = "id">006</field> 
      <field name = "first name">Scarlett</field> 
      <field name = "phone">+148022335</field> 
      <field name = "city">Kentucky</field> 
   </doc> 
</add>

如我们所见,为向索引文件添加数据而创建的 XML 文件包含给定的三个重要标签,分别命名为: text 、 text 和 文本 .

- add 标签是添加索引文档的根标签。它获取将添加到索引中的一个或多个文档。

- 我们添加的数据应该包含在 文本这里 标签下。给定的文档包含字段形式的数据。

- 此标签保存我们添加的数据字段的名称和值。

创建文档后,我们可以通过索引中讨论的方式将创建的文档添加到索引中。

假设XML文件存在于Solr的bin目录中,它是在 my_core 文件中被索引,然后我们可以使用下面给出的 post 工具将它添加到 Solr 的索引-

[Hadoop@localhost bin]$ ./post-c my_core sample.xml

当我们运行上面给出的命令时,我们会得到下面的结果。

/home/Hadoop/java/bin/java-classpath /home/Hadoop/Solr/dist/Solr-
Core8.2.0.jar-Dauto = yes-Dc = my_core-Ddata = files 
org.apache.Solr.util.SimplePostTool sample.xml 
SimplePostTool version 5.0.0 
Posting files to [base] url http://localhost:8983/Solr/my_core/update... 
Entering auto mode. File endings considered are xml,json,jsonl,csv,pdf,doc,docx,ppt,pptx,
xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt,log 
POSTing file sample.

xml

(application/xml) to [base] 
1 files indexed. 
COMMITting Solr index changes to http://localhost:8983/Solr/my_core/update... 
Time spent: 0:00:00.201

 

验证

转到 Apache Solr Web UI 的主页并选择 my_core 文件。尝试在文本区域 q 中绕过查询": "获取所有文档并运行查询。执行后,我们可以观察到想要的数据添加到了 Solr 索引中。

Apache Solr-添加文档

 下面给出了 XML 文件,用于更新现有文档中的一个文件。您必须使用名称 update.xml 保存此文件。<add> <doc> <field name ="id"&g ...