如何使用 XPath 忽略名称空间

我的目标是使用 XPath 从具有多个名称空间的多个 XML 文件中提取某些节点。只要我知道名称空间 URI,一切都可以正常工作。名称空间名称本身保持不变,但 Schema (XSD)有时是客户机生成的,即我不知道。那么我基本上只剩下三个选择:

  1. 只对名称空间使用一个模式,希望没有出错(我能确定吗?)。
  2. 获取文档的子节点并查找带有名称空间 URI 的第一个节点,希望它在那里,并只使用 URI,希望它是正确的节点。出现这种情况的原因有很多
  3. 告诉 xpath: “瞧,我不关心名称空间,只要找到所有具有这个名称的节点,我甚至可以告诉您名称空间的名称,但不能告诉您 URI”。这就是问题所在。

这并不是重复许多“我的 xpath 表达式无法工作,因为我没有意识到名称空间感知”的问题,如 给你给你。我知道如何使用名称空间感知,但不知道如何去除它。

117358 次浏览

可以使用 local-name() XPath 函数

/path/to/x:somenode

您可以选择所有节点并筛选具有正确本地名称的节点:

/path/to/*[local-name() = 'somenode']

您可以在 XPath2.0中使用不那么冗长的语法执行同样的操作:

/path/to/*:somenode

可以在 XmlTextReader 上使用 Namespace = false

[TestMethod]
public void MyTestMethod()
{
string _withXmlns = @"<?xml version=""1.0"" encoding=""utf-8""?>
<ParentTag xmlns=""http://anyNamespace.com"">
<Identification value=""ID123456"" />
</ParentTag>
";


var xmlReader = new XmlTextReader(new MemoryStream(Encoding.Default.GetBytes(_withXmlns)));


xmlReader.Namespaces = false;


var content = XElement.Load(xmlReader);


XElement elem = content.XPathSelectElement("/Identification");


elem.Should().NotBeNull();
elem.Attribute("value").Value.Should().Be("ID123456");
}

与:

using System;
using System.IO;
using System.Linq;
using System.Text;
using System.Xml;
using System.Xml.Linq;
using System.Xml.XPath;
using FluentAssertions;
using Microsoft.VisualStudio.TestTools.UnitTesting;

或者可以使用 name () :

/path/to/*[name() = 'somenode']

或者只是搜索属性:

//*[@attribute="this one"]

如果将 xml 作为 powershell 对象打开,它将忽略名称空间:

[xml]$xml = get-content file.xml
$xml.path.to.somenode

这是我在 Qt C + + 中的例子,Qt 支持 XPath 2.0:

    QString planePath = ":/Models/Plane.dae";
QFile f(planePath);
if (!f.open(QIODevice::ReadOnly))
{
std::cerr << "Failed to load the file: " <<
planePath.toStdString() << std::endl;
return;
}


QXmlQuery query;
query.bindVariable("myFile", &f);
//    query.setQuery("doc($myFile)//*[local-name() = 'p']/text()"); // it works too but it is XPath 1.0
query.setQuery("doc($myFile)//*:p/text()");


QString result;
query.evaluateTo(&result);
qDebug() << result;
f.close();

程序输出: "1 0 0 2 0 1 0 0 2 1 0 3 3 0 4 2 0 5\n"

飞机,大

<?xml version="1.0" encoding="utf-8"?>
<COLLADA xmlns="http://www.collada.org/2005/11/COLLADASchema" version="1.4.1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<asset>
<contributor>
<author>Blender User</author>
<authoring_tool>Blender 2.83.3 commit date:2020-07-22, commit time:06:01, hash:353e5bd7493e</authoring_tool>
</contributor>
<created>2020-08-03T14:03:19</created>
<modified>2020-08-03T14:03:19</modified>
<unit name="meter" meter="1"/>
<up_axis>Z_UP</up_axis>
</asset>
<library_effects>
<effect id="PlaneMaterial-effect">
<profile_COMMON>
<technique sid="common">
<lambert>
<emission>
<color sid="emission">0 0 0 1</color>
</emission>
<diffuse>
<color sid="diffuse">0.01664001 0.8000001 0.01191879 1</color>
</diffuse>
<reflectivity>
<float sid="specular">0.5</float>
</reflectivity>
</lambert>
</technique>
</profile_COMMON>
</effect>
</library_effects>
<library_images/>
<library_materials>
<material id="PlaneMaterial-material" name="PlaneMaterial">
<instance_effect url="#PlaneMaterial-effect"/>
</material>
</library_materials>
<library_geometries>
<geometry id="Plane-mesh" name="Plane">
<mesh>
<source id="Plane-mesh-positions">
<float_array id="Plane-mesh-positions-array" count="12">-1 -1 0 1 -1 0 -1 1 0 1 1 0</float_array>
<technique_common>
<accessor source="#Plane-mesh-positions-array" count="4" stride="3">
<param name="X" type="float"/>
<param name="Y" type="float"/>
<param name="Z" type="float"/>
</accessor>
</technique_common>
</source>
<source id="Plane-mesh-normals">
<float_array id="Plane-mesh-normals-array" count="3">0 0 1</float_array>
<technique_common>
<accessor source="#Plane-mesh-normals-array" count="1" stride="3">
<param name="X" type="float"/>
<param name="Y" type="float"/>
<param name="Z" type="float"/>
</accessor>
</technique_common>
</source>
<source id="Plane-mesh-map-0">
<float_array id="Plane-mesh-map-0-array" count="12">1 0 0 1 0 0 1 0 1 1 0 1</float_array>
<technique_common>
<accessor source="#Plane-mesh-map-0-array" count="6" stride="2">
<param name="S" type="float"/>
<param name="T" type="float"/>
</accessor>
</technique_common>
</source>
<vertices id="Plane-mesh-vertices">
<input semantic="POSITION" source="#Plane-mesh-positions"/>
</vertices>
<triangles material="PlaneMaterial-material" count="2">
<input semantic="VERTEX" source="#Plane-mesh-vertices" offset="0"/>
<input semantic="NORMAL" source="#Plane-mesh-normals" offset="1"/>
<input semantic="TEXCOORD" source="#Plane-mesh-map-0" offset="2" set="0"/>
<p>1 0 0 2 0 1 0 0 2 1 0 3 3 0 4 2 0 5</p>
</triangles>
</mesh>
</geometry>
</library_geometries>
<library_visual_scenes>
<visual_scene id="Scene" name="Scene">
<node id="Plane" name="Plane" type="NODE">
<matrix sid="transform">1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1</matrix>
<instance_geometry url="#Plane-mesh" name="Plane">
<bind_material>
<technique_common>
<instance_material symbol="PlaneMaterial-material" target="#PlaneMaterial-material">
<bind_vertex_input semantic="UVMap" input_semantic="TEXCOORD" input_set="0"/>
</instance_material>
</technique_common>
</bind_material>
</instance_geometry>
</node>
</visual_scene>
</library_visual_scenes>
<scene>
<instance_visual_scene url="#Scene"/>
</scene>
</COLLADA>