mirror of
https://github.com/Unstructured-IO/unstructured.git
synced 2025-07-24 09:26:08 +00:00
402 lines
10 KiB
JSON
402 lines
10 KiB
JSON
![]() |
[
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "79f952030bc16724f51bcd4264fa9e60",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "79f952030bc16724f51bcd4264fa9e60",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "79f952030bc16724f51bcd4264fa9e60",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "79f952030bc16724f51bcd4264fa9e60",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "79f952030bc16724f51bcd4264fa9e60",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "79f952030bc16724f51bcd4264fa9e60",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "79f952030bc16724f51bcd4264fa9e60",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "79f952030bc16724f51bcd4264fa9e60",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "79f952030bc16724f51bcd4264fa9e60",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "79f952030bc16724f51bcd4264fa9e60",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "79f952030bc16724f51bcd4264fa9e60",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "79f952030bc16724f51bcd4264fa9e60",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "79f952030bc16724f51bcd4264fa9e60",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "79f952030bc16724f51bcd4264fa9e60",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3 testtext3"
|
||
|
},
|
||
|
{
|
||
|
"type": "ListItem",
|
||
|
"element_id": "7be2188650903e8cb47b4ad6834f2855",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 List Item 1Testdoc3 List Item 1 Nested Item ATestdoc3 List Item 1 Nested Item B"
|
||
|
},
|
||
|
{
|
||
|
"type": "ListItem",
|
||
|
"element_id": "150c2a750c17f7ba420ee3b2fa5ddd05",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 List Item 2"
|
||
|
},
|
||
|
{
|
||
|
"type": "ListItem",
|
||
|
"element_id": "58afe13278b87a97553da292ff2f4a5d",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 List Item 3"
|
||
|
},
|
||
|
{
|
||
|
"type": "ListItem",
|
||
|
"element_id": "b2aabb64faf2e75a269afcf0b9069769",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 List Item 4"
|
||
|
},
|
||
|
{
|
||
|
"type": "ListItem",
|
||
|
"element_id": "a823ee15866f03f883ff4c8e3fd74d0a",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 List Item 5"
|
||
|
},
|
||
|
{
|
||
|
"type": "NarrativeText",
|
||
|
"element_id": "3d15d9222ffb2770ceede5b6532e842a",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "This is the link for unstructured . io."
|
||
|
},
|
||
|
{
|
||
|
"type": "ListItem",
|
||
|
"element_id": "2afcc8bc3f0e6780b736c4c008407494",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 Checklist Item 1"
|
||
|
},
|
||
|
{
|
||
|
"type": "ListItem",
|
||
|
"element_id": "7b1f1e10038f0059bc10eb5029387026",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 Checklist Item 2 (checked)"
|
||
|
},
|
||
|
{
|
||
|
"type": "ListItem",
|
||
|
"element_id": "63da5a7ac980c213a66c1d12b41850c9",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 Checklist Item 3"
|
||
|
},
|
||
|
{
|
||
|
"type": "UncategorizedText",
|
||
|
"element_id": "86e0e9ce51725074a3dc41ed3f10c13c",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "😃 😃 😃 😃 😃 😃 😃 😃 😃 😃 😃 😃"
|
||
|
},
|
||
|
{
|
||
|
"type": "NarrativeText",
|
||
|
"element_id": "7ea4536a8f68aea99e35afc364d1a66d",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 bold text"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "b6eca69d7b7cf8e67fca6fe167e1ae3d",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 italic text"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "3e1de41c1e2ae05a3b445ca757d5dcad",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 Heading 1 Sized Text"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "5c99ed47550665c65505f840d3b86b8f",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 Heading 2 Sized Text"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "5595c0e3b14f2eac3834aa78a2fc1027",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 Heading 3 Sized Text"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "0f55b2b1d85ed7f62e3bd852ba3d8c51",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 Heading 4 Sized Text"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "d0218c7c71bb57c842286628e5a4e8d6",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 Heading 5 Sized Text"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "a980779f0a4dcb2fbf46641f3d55fbf8",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 Table: Column 1 Row 0"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "0a04f24b652d60a333c4ab7cb407703a",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 Table: Column 2 Row 0"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "0301eff44f871fbda777aa0237a0f452",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 Table: Column 3 Row 0"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "23f1bd85c5fad540ef96b0872e74e7a4",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 Table: Column 1 Row 1"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "10c66e15332d59c91094e825685044d2",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 Table: Column 2 Row 1"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "f27232db61c551577ee4ea73a08e7539",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 Table: Column 3 Row 1"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "2a83da2e0f9c1bc4950962ffd50c2611",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 Table: Column 1 Row 2"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "aad2133b4d02da862062868452a19f2d",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 Table: Column 2 Row 2"
|
||
|
},
|
||
|
{
|
||
|
"type": "Title",
|
||
|
"element_id": "1d5426ac7bb0a72e5e85f81590b05645",
|
||
|
"metadata": {
|
||
|
"data_source": {},
|
||
|
"filetype": "text/html",
|
||
|
"page_number": 1
|
||
|
},
|
||
|
"text": "Testdoc3 Table: Column 3 Row 2"
|
||
|
}
|
||
|
]
|