WEFV2626EFCEYYYB15VEF

 

內容簡介

  一個國家信用體系的崩潰,不僅僅會給國民經濟和國民消費信心帶來損害,還將對整個社會體系形成深遠影響。
──著名經濟學家,吳敬璉

  中華文化千年流傳,歷史積澱下來的「無信不立」思想,在「大躍進」企圖「一步到位」的荒唐政策下,徹底崩解。各行各業、由上到下,無不「製假造假」、「貪污詐騙」,到處充斥許多虛假和欺詐──假酒、假藥、假煙、假發票、假履歷、假合同,甚至還有假官員、假公署,無孔不入的「假」橫行不絕……背信棄義成了中國人司空見慣、見怪不怪的離奇現象。

  全書由一群企盼真理的中央電視台CCTV記者,不惜冒著身家安全與政治禁忌,在長期的蒐集資料與深度的追蹤調查之下彙整而成,內容全是一般人無法窺伺的「禁區」和第一手幕後真相,所涉之人、事、時、地、物,俱為事實、毫不隱瞞,一幕幕揭開足以動搖國本的道德淪喪和誠信危機。

一個良心的建議 ── 到中國前,先看看這本書!

作者簡介

駱漢城

  1951年生,中國中央電視台新聞中心高級記者,從事新聞工作近30年,評論、策劃和製作過許多新聞和紀實性的單元節目,其組織拍攝的《暗訪無極假藥市場》,更是全中國電視媒體最早以暗訪形式進行的報導。曾多次獲得國家級各類新聞獎項,其中包括三次「中國新聞獎」。著有《共和國在打假》、《與古文明對話》、《穿越無人區》、《在火上行走──隱性採訪的法律思考》、《玉石溯源》、《中國誠信的背後》(大都會文化出版)等作品。

目錄

第一章 誠信之殤
.附骨之蛆
.賴帳有理
.楊白勞翻身記
.託:騙你沒商量
.誠信有「盜」
.誠在何處
.機不可尋

第二章 授業之惑
.誠信貶值
.考場舞弊
.「槍手」傳奇
.助學貸款的遭遇
.這樣的園丁能澆得好花嗎?

第三章 醫藥之患守之下患
.注水的瘋狂
.「非典」假藥
.掛鹿頭,賣羊肉
.老黃瓜刷綠漆
.醫療垃圾是怎樣變成實用器皿的

第四章 金融「魔術」
.英才沉浮
.會計多大膽,公司多大產
.偷稅無罪,作假有理
.信用是個「卡」
.無效承諾
.失衡的天平

第五章 商業之戰利
.「賣布頭」的重演
.手機的危機
.誰是誰非
.無奈的自衛
.失信難平
.為誰而戰

第六章 民生之難
.誠信無小事
.民以食為天
.「毒油」黑幕
.土法醃菜,化腐朽為神奇
.雞精裡的「秘密」

第七章 安得廣廈千萬間
.致命裝修
.信用有價
.不穩定的房基
.麻煩的爛尾樓
.民生難違
.命值幾錢
.跳樓作秀

第八章 管窺官政
.為官不誠
.只剩神靈
.59歲現象
.美國有個「二奶村」
.貪官外逃
.路在腳下

第九章 誠信立足
.高昂的成本
.誠信更新
.誠信之源
.源遠流長
.立足誠信
.雙贏是金

第十章 再造明天
.誠信紅燈
.誠信是本
.信用產業
.再造明天

 

誠信天下

崔曉黎

  經歷了長達15年馬拉松式的談判,中國終於在2001年底正式加入了世界貿易組織。這是中國參與全球經濟競爭的新紀元。世界貿易組織總幹事穆爾在熱情歡迎中國成為世貿組織新成員的同時,提出了真誠的告誡:中國加入世貿組織後,從長遠看,缺的不是資金、技術和人才,而是誠信或者說是信用,以及建立信用體系的機制。

  穆爾的忠告,一語點中了制約我國社會經濟發展和進步的軟肋,點中了我們能否緊緊抓住21世紀頭二十年重要戰略機遇期的薄弱環節。

  近年來,在我國經濟和社會生活中,失信現象如瘟疫般到處流行,兇狠而又暴戾,從假煙、假酒、假文憑,到假賬目、假評估、假簽證、假報告;從普通人惡意消費透支,到一些官員言行不一政績注水;從股市造假,到會計師事務所等仲介機構「蛇鼠同穴」;從「三角債」滾雪球般越滾越大,到少數地方政府出爾反爾對投資者「宰肥羊」;從為人師表的教授剽竊他人的著作,到足球場上的「狗吹黑哨滿天飛」……

  老百姓們不無痛苦地發現,自己生活的大大小小的圈子?充滿著欺詐、?造、造假等不誠實的行為。的確,大到?業財經的「基金黑幕」、「銀廣廈騙局」、「東方電子造假」等,小到百姓民生的山西假酒、河南毒米、廣東瘦肉精事件以及南京冠生園的「陳餡月餅」,多少人的辛苦錢不翼而飛,多少人被騙得傾家蕩產,一系列的失信事件不僅讓人觸目驚心,而且讓老百姓對社會充滿了「整體信用危機」感。假冒?劣?品橫行和缺少信用保證已?生了惡劣的社會影響,「誠信的缺失」已經嚴重阻礙了消費和投資行為。有專家分析認為,由於我國市場交易缺乏信用體制,每年國民生產總值的10%到20%是無效成本,直接和間接經濟損失每年高達5855億元。

  失信行為並非出自今天,古代也不乏其例。西周末年,周幽王為博褒姒一笑,烽火戲諸侯,拿國家的信譽當兒戲,西周亡。西元前356年,秦孝公六年,秦國商鞅變法,「立木為信」,一市井小民,只舉手之勞得賞重金,然誠信立,變法得以推行,國興。古云:國之大事,惟祀與戎。祀者,國託命於天取信於民。取信於民,或失信於民,關乎國運天命,史之通鑒。就個人來講,同理。小學課本中有一篇流傳很廣的課文,題目是《狼來了》。文中所講的放羊娃不誠實,故意戲弄村民,喊狼來了。結果村民幾次被騙,當狼真的來了,村民再也不信了。這則類似「伊索寓言」式的故事,內容簡單但寓意深刻。正所謂「人無信不立」。在中國,誠信是一個哲學概念,即天人合一的世界觀。其涵蓋範圍遠遠超出了倫理道德的範圍。誠信、信仰、信譽,其意有專,實本一也。從字形看,誠信兩字均從言,從人,從口,謂之誠信託於人言。《說文解字》對此兩字互釋,即誠者信也,信者誠也,兩字相通,實為一意。

  人之言於天於地,可謂輕,但於規、於理、於德、於道,則可謂「惟此惟大」。大者止於天,觀於海。 誠信之大如海之茫茫,其涯幾不可及;誠信是一本「經」,是一條首尾不見的大河,滔滔東去,逝者如斯,其途幾不可尋。建國以來直到今天,老百姓常說一句話:共產黨不會不管我們。意思是說不論碰到多大的災難,老百姓總會有飯吃。這句話今天的年輕人可能會覺得索然無味,更何談「意味深長」?但在那個慘遭百年蹂躪後的年代,餓殍遍野,民無蓋藏,他們乞求有一碗「厚粥」,有一件寒衣,有一簷擋雨,有一席裹屍,面對如此慘烈國破家亡的局面,人民能說出這句話,其語重如泰山,其聲聞達於天。這是天大的信任,這是在向一個新政權「託命」。

  新中國風風雨雨半個多世紀,國家有過太多的輝煌,但也有過不少這樣那樣的失誤,甚至是很大的錯誤,但老百姓始終堅信共產黨不會餓死人,遇到大災大難政府會管我們。這話太樸素了一點,但真正的大道理往往就蘊涵在其中。中國哲學講:大音無聲,大道無形。老百姓的這句話就是「大道」。這也正是新中國雖然多災多難但始終不敗,不斷走向興盛的根本原因。

  1952年2月10日,有兩位為共和國的創立立有大功的高級幹部,劉青山、張子善因貪污受賄,走上刑場。這是新中國開國後因腐敗而發的第一大案。當時不是沒有人陳情力保刀下留人,但毛澤東堅決不為所動,因為民意難違,天理不容。這是一種承諾,是新中國的第一次「祭天」。共和國歷史上有過三年「大饑荒」。毛澤東三不吃:不吃肉、不吃魚、不吃蛋,以示與民共渡難關。中國之大,何愁一人之口。但那不是幾斤肉的問題,那是領袖與人民之間的一種誠信。

  1960年冬,河南省信陽地區,一月之間非正常死亡逾百萬。國家糧倉近在咫尺,但無一例農民開倉搶糧的事情發生。民之赤誠兮惟有痛哭,信也。

  一位老領導幹部曾回憶一件難忘的往事,三年困難時期,在一次國務院的會議上,一個領導建議總理是否可以考慮增加一點農業稅。周總理當時提高嗓門毫不猶豫地說:請記錄在案,我活著當總理的時候你們不要打農民的主意,我死了以後你們也不要打農民的主意。這是共和國總理在兌現政府對農民的承諾。其背景是,解放之初,我黨制定了在農村實行休養生息的政策,該政策周總理在一次會議上正式宣佈過,後由於抗美援朝戰爭的爆發,這一政策推遲。1958年在人代會上正式把農業稅率定為15.5%。之後,由於我國農村經濟長期發展緩慢,農業稅的實物量實際再沒有增加。到1978年,農業稅縮減到只有3%左右。周總理對農民沒有食言,直到他走,始終沒有打過農民的主意,因為:誠信是不能談判的。

  人民的好幹部,好兒子焦裕祿臨終遺言:死後埋在沙丘。他要親眼看到蘭考老百姓的生活好起來,他要實現自己任職縣委書記時的承諾。「沙丘」,那是蘭考老百姓心中的「神壇」。

  1978年8月14日,新華社報道,一機部部長周子健,帶領全國機械工業學大慶會議的代表和部機關幹部數千人,到通縣張家灣「背」回了不合格的拖拉機,並賠償了這個公社的損失。這件事在今天看來也許會被有些人認為是小題大做,或者是為了製造熱點新聞。部長在國際社會被認為是國家內閣成員,這位周部長能對一台不合格的拖拉機承擔責任,這是一種公僕的誠信。這種誠信,我們要做「禮拜」。

  1979年11 月25日,發生渤海2號石油鑽井平臺翻沈重大事故,造成72人死亡。事後中央對所有事故責任人進行了處分,觸犯刑律的送交到司法機關依法處理。其中最引國人議論的是,時任國務院副總理的康世恩受到記大過的處分。康世恩的大名當時幾乎無人不曉,他是我國大慶油田的開創者和功臣之一。大慶油田的開發成功,對於共和國來說,其意義絕不亞於「兩彈一星」。康世恩受處分,對於當時的黨中央來講,無疑是「揮淚斬馬謖」。古云:軍中無戲言,同樣執政也無戲言,因為那是鐵一樣的「公信」。

  誠信在中國的傳統文化中,核心是指社會運行中,政府與老百姓必須要遵循的行為規範。古人謂之「大道」。對於中國來講,誠信滑坡如果發展下去的話,其後果是致命性的。中國是一個有著悠久文明歷史的國家,重誠守信,歷來都是中華民族的傳統。中國有充分的自信把這一優良傳統一代一代傳承下去。中國誠信走過了歷史,走進了現代,還要走向未來。誠信是社會的,同時也是每一個人的。

  中國改革開放已近四分之一世紀,光陰似箭一代人矣。25年中國經濟發展之快,變化之大,令國人大有滄海桑田之感。20年前國人還分不清外國的高速公路與北京的長安街有什?區別;20年後的今天,中國的高速公路通車里程已位居世界第二。10年前,國人對移動通信還很生疏,手機還只是少數高級白領的「專用」設備,10年後的今天,中國移動電話客戶用量已位居世界第一,城裡擺地攤的小販也是滿口的「摩托羅拉」、「諾基亞」。1958年大躍進時期全民大煉鋼鐵,目標是1070萬噸鋼,超過英國。此舉幾乎把中國的國民經濟拖垮。45年後的今天,中國的鋼?量已超過1.8億噸,已連續7年位居世界第一。

  農業、工業、服務業,已經有太多的世界第一。如果以世界第一的數量來評比「吉尼斯」的話,中國奪魁,勢在必得。中國用了整整一百多年的時間,積幾代人之努力,才砸開了「閉關鎖國」的大鎖,徐徐推開了通往現代化的大門。中國走向了世界,這是一個光怪陸離的世界,但絕不是天堂。這是一條不得不過的大河,而且它絕不是風平浪靜的。眼前的路蜿蜒曲折充滿荊棘。「路漫漫其修遠兮,吾將上下而求索」,這話好多人不懂,用老百姓的話說就是,「摸著石頭過河」。還是魯迅先生說得對,「地上本沒有路,走得人多了也便成了路」。但國人沒有想到,這走向世界的取經之路,也要過九九八十一難,一路上也要降妖除怪。世界給中國送了一把鮮花,又給中國當頭潑了一盆冷水——越來越多的看不懂,越來越多的為什麼。這一課,不能不上。

 

詳細資料

  • ISBN:9867651723
  • 叢書系列:
  • 規格:平裝 / 320頁 / 普通級 / 單色印刷 / 初版
  • 出版地:台灣
  • 本書分類:> >

 

 

簡介 ES是一個基於RESTful web接口並且構建在Apache Lucene之上的開源分布式搜尋引擎。 同時ES還是一個分布式文檔資料庫,其中每個欄位均可被索引,而且每個欄位的數據均可被搜索,能夠橫向擴展至數以百計的伺服器存儲以及處理PB級的數據。 可以在極短的時間內存儲、搜索和分析大量的數據。通常作為具有複雜搜索場景情況下的核心發動機。 ES就是為高可用和可擴展而生的。一方面可以通過升級硬體來完成系統擴展,稱為垂直或向上擴展(Vertical Scale/Scaling Up)。 另一方面,增加更多的伺服器來完成系統擴展,稱為水平擴展或者向外擴展(Horizontal Scale/Scaling Out)。儘管ES能夠利用更強勁的硬體,但是垂直擴展畢竟還是有它的極限。真正的可擴展性來自於水平擴展,通過向集群中添加更多的節點來分擔負載,增加可靠性。ES天生就是分布式的,它知道如何管理多個節點來完成擴展和實現高可用性。意味應用不需要做任何的改動。 ... Gateway,代表ES索引的持久化存儲方式。在Gateway中,ES默認先把索引存儲在內存中,然後當內存滿的時候,再持久化到Gateway里。當ES集群關閉或重啟的時候,它就會從Gateway里去讀取索引數據。比如LocalFileSystem和HDFS、AS3等。 DistributedLucene Directory,它是Lucene里的一些列索引文件組成的目錄。它負責管理這些索引文件。包括數據的讀取、寫入,以及索引的添加和合併等。 River,代表是數據源。是以插件的形式存在於ES中。 Mapping,映射的意思,非常類似於靜態語言中的數據類型。比如我們聲明一個int類型的變量,那以後這個變量只能存儲int類型的數據。比如我們聲明一個double類型的mapping欄位,則只能存儲double類型的數據。 Mapping不僅是告訴ES,哪個欄位是哪種類型。還能告訴ES如何來索引數據,以及數據是否被索引到等。 Search Moudle,搜索模塊,支持搜索的一些常用操作 Index Moudle,索引模塊,支持索引的一些常用操作 Disvcovery,主要是負責集群的master節點發現。比如某個節點突然離開或進來的情況,進行一個分片重新分片等。這裡有個發現機制。 發現機制默認的實現方式是單播和多播的形式,即Zen,同時也支持點對點的實現。另外一種是以插件的形式,即EC2。 Scripting,即腳本語言。包括很多,這裡不多贅述。如mvel、js、python等。 Transport,代表ES內部節點,代表跟集群的客戶端交互。包括 Thrift、Memcached、Http等協議 RESTful Style API,通過RESTful方式來實現API編程。 3rd plugins,代表第三方插件。 Java(Netty),是開發框架。 JMX,是監控。 使用案例 1、將ES作為網站的主要後端系統 比如現在搭建一個博客系統,對於博客帖子的數據可以直接在ES上存儲,並且使用ES來進行檢索,統計。ES提供了持久化的存儲、統計和很多其他數據存儲的特性。 注意:但是像其他的NOSQL數據存儲一樣,ES是不支持事務的,如果要事務機制,還是考慮使用其他的資料庫做真實庫。 ... 2、將ES添加到現有系統 有些時候不需要ES提供所有數據的存儲功能,只是想在一個數據存儲的基礎之上使用ES。比如已經有一個複雜的系統在運行,但是現在想加一個搜索的功能,就可以使用該方案。 ... 3、將ES作為現有解決方案的後端部分 因為ES是開源的系統,提供了直接的HTTP接口,並且現在有一個大型的生態系統在支持他。比如現在我們想部署大規模的日誌框架、用於存儲、搜索和分析海量的事件,考慮到現有的工具可以寫入和讀取ES,可以不需要進行任何開發,配置這些工具就可以去運作。 ... 設計結構 1、邏輯設計 文檔 文檔是可以被索引的信息的基本單位,它包含幾個重要的屬性: 是自我包含的。一篇文檔同時包含欄位和他們的取值。 是層次型的。文檔中還可以包含新的文檔,一個欄位的取值可以是簡單的,例如location欄位的取值可以是字符串,還可以包含其他欄位和取值,比如可以同時包含城市和街道地址。 擁有靈活的結構。文檔不依賴於預先定義的模式。也就是說並非所有的文檔都需要擁有相同的欄位,並不受限於同一個模式 { "name":"meeting", "location":"office", "organizer":"yanping" } { "name":"meeting", "location":{ "name":"sheshouzuo", "date":"2019-6-28" }, "memebers":["leio","shiyi"] } 類型 類型是文檔的邏輯容器,類似於表格是行的容器。在不同的類型中,最好放入不同的結構的文檔。 欄位 ES中,每個文檔,其實是以json形式存儲的。而一個文檔可以被視為多個欄位的集合。 映射 每個類型中欄位的定義稱為映射。例如,name欄位映射為String。 索引 索引是映射類型的容器一個ES的索引非常像關係型世界中的資料庫,是獨立的大量文檔集合。 關係型資料庫與ES的結構上的對比 ... 2、物理設計 節點 一個節點是一個ES的實例,在伺服器上啟動ES之後,就擁有了一個節點,如果在另一個伺服器上啟動ES,這就是另一個節點。甚至可以在一臺伺服器上啟動多個ES進程,在一臺伺服器上擁有多個節點。多個節點可以加入同一個集群。 當ElasticSearch的節點啟動後,它會利用多播(multicast)(或者單播,如果用戶更改了配置)尋找集群中的其它節點,並與之建立連接。這個過程如下圖所示: ... 節點主要有3種類型,第一種類型是client_node,主要是起到請求分發的作用,類似路由。第二種類型是master_node,是主的節點,所有的新增,刪除,數據分片都是由主節點操作(elasticsearch底層是沒有更新數據操作的,上層對外提供的更新實際上是刪除了再新增),當然也能承擔搜索操作。第三種類型是date_node,該類型的節點只能做搜索操作,具體會分配到哪個date_node,就是由client_node決定,而data_node的數據都是從master_node同步過來的 分片 一個索引可以存儲超出單個結點硬體限制的大量數據。比如,一個具有10億文檔的索引占據1TB的磁碟空間,而任一節點都沒有這樣大的磁碟空間;或者單個節點處理搜索請求,響應太慢。 為了解決這個問題,ES提供了將索引劃分成多份的能力,這些份就叫做分片。當你創建一個索引的時候,你可以指定你想要的分片的數量。每個分片本身也是一個功能完善並且獨立的「索引」,這個「索引」可以被放置到集群中的任何節點上。 分片之所以重要,主要有兩方面的原因: 1、允許你水平分割/擴展你的內容容量 允許你在分片(潛在地,位於多個節點上)之上進行分布式的、並行的操作,進而提高性能/吞吐量 至於一個分片怎樣分布,它的文檔怎樣聚合回搜索請求,是完全由ES管理的,對於作為用戶的你來說,這些都是透明的。 2、在一個網絡/雲的環境裡,失敗隨時都可能發生,在某個分片/節點不知怎麼的就處於離線狀態,或者由於任何原因消失了。這種情況下,有一個故障轉移機制是非常有用並且是強烈推薦的。為此目的,ES允許你創建分片的一份或多份拷貝,這些拷貝叫做複製分片,或者直接叫複製。 複製之所以重要,主要有兩方面的原因: (1)在分片/節點失敗的情況下,提供了高可用性。因為這個原因,注意到複製分片從不與原/主要(original/primary)分片置於同一節點上是非常重要的。 (2)擴展你的搜索量/吞吐量,因為搜索可以在所有的複製上並行運行 總之,每個索引可以被分成多個分片。一個索引也可以被複製0次(意思是沒有複製)或多次。一旦複製了,每個索引就有了主分片(作為複製源的原來的分片)和複製分片(主分片的拷貝)之別。分片和複製的數量可以在索引創建的時候指定。在索引創建之後,你可以在任何時候動態地改變複製數量,但是不能改變分片的數量。 默認情況下,ES中的每個索引被分片5個主分片和1個複製,這意味著,如果你的集群中至少有兩個節點,你的索引將會有5個主分片和另外5個複製分片(1個完全拷貝),這樣的話每個索引總共就有10個分片。一個索引的多個分片可以存放在集群中的一臺主機上,也可以存放在多臺主機上,這取決於你的集群機器數量。主分片和複製分片的具體位置是由ES內在的策略所決定的。 3、插件HEAD elasticsearch-head是一個介面化的集群操作和管理工具 ... ● node:即一個 Elasticsearch 的運行實例,使用多播或單播方式發現 cluster 並加入。 ● cluster:包含一個或多個擁有相同集群名稱的 node,其中包含一個master node。 ● index:類比關係型資料庫里的DB,是一個邏輯命名空間。 ● alias:可以給 index 添加零個或多個alias,通過 alias 使用index 和根據index name 訪問index一樣,但是,alias給我們提供了一種切換index的能力,比如重建了index,取名● customer_online_v2,這時,有了alias,我要訪問新 index,只需要把 alias 添加到新 index 即可,並把alias從舊的 index 刪除。不用修改代碼。 ● type:類比關係資料庫里的Table。其中,一個index可以定義多個type,但一般使用習慣僅配一個type。 ● mapping:類比關係型資料庫中的 schema 概念,mapping 定義了 index 中的 type。mapping 可以顯示的定義,也可以在 document 被索引時自動生成,如果有新的 field,Elasticsearch 會自動推測出 field 的type並加到mapping中。 ● document:類比關係資料庫里的一行記錄(record),document 是 Elasticsearch 里的一個 JSON 對象,包括零個或多個field。 ● field:類比關係資料庫里的field,每個field 都有自己的欄位類型。 ● shard:是一個Lucene 實例。Elasticsearch 基於 Lucene,shard 是一個 Lucene 實例,被 Elasticsearch 自動管理。之前提到,index 是一個邏輯命名空間,shard 是具體的物理概念,建索引、查詢等都是具體的shard在工作。shard 包括primary shard 和 replica shard,寫數據時,先寫到primary shard,然後,同步到replica shard,查詢時,primary 和 replica 充當相同的作用。replica shard 可以有多份,也可以沒有,replica shard的存在有兩個作用,一是容災,如果primary shard 掛了,數據也不會丟失,集群仍然能正常工作;二是提高性能,因為replica 和 primary shard 都能處理查詢。另外,如上圖右側紅框所示,shard數和replica數都可以設置,但是,shard 數只能在建立index 時設置,後期不能更改,但是,replica 數可以隨時更改。但是,由於 Elasticsearch 很友好的封裝了這部分,在使用Elasticsearch 的過程中,我們一般僅需要關注 index 即可,不需關注shard。 shard、node、cluster 在物理上構成了 Elasticsearch 集群,field、type、index 在邏輯上構成一個index的基本概念,在使用 Elasticsearch 過程中,我們一般關注到邏輯概念就好,就像我們在使用MySQL 時,我們一般就關注DB Name、Table和schema即可,而不會關注DBA維護了幾個MySQL實例、master 和 slave 等怎麼部署的一樣。 ES中的索引原理 (1)傳統的關係型資料庫 二叉樹查找效率是logN,同時插入新的節點不必移動全部節點,所以用樹型結構存儲索引,能同時兼顧插入和查詢的性能。因此在這個基礎上,再結合磁碟的讀取特性(順序讀/隨機讀),傳統關係型資料庫採用了B-Tree/B+Tree這樣的數據結構做索引 (2)ES 採用倒排索引 那麼,倒排索引是個什麼樣子呢? 首先,來搞清楚幾個概念,為此,舉個例子: 假設有個user索引,它有四個欄位:分別是name,gender,age,address。畫出來的話,大概是下面這個樣子,跟關係型資料庫一樣 Term(單詞):一段文本經過分析器分析以後就會輸出一串單詞,這一個一個的就叫做Term Term Dictionary(單詞字典):顧名思義,它裡面維護的是Term,可以理解為Term的集合 Term Index(單詞索引):為了更快的找到某個單詞,我們為單詞建立索引 Posting List(倒排列表):倒排列表記錄了出現過某個單詞的所有文檔的文檔列表及單詞在該文檔中出現的位置信息,每條記錄稱為一個倒排項(Posting)。根據倒排列表,即可獲知哪些文檔包含某個單詞。(PS:實際的倒排列表中並不只是存了文檔ID這麼簡單,還有一些其它的信息,比如:詞頻(Term出現的次數)、偏移量(offset)等,可以想像成是Python中的元組,或者Java中的對象) (PS:如果類比現代漢語詞典的話,那麼Term就相當於詞語,Term Dictionary相當於漢語詞典本身,Term Index相當於詞典的目錄索引) 我們知道,每個文檔都有一個ID,如果插入的時候沒有指定的話,Elasticsearch會自動生成一個,因此ID欄位就不多說了 上面的例子,Elasticsearch建立的索引大致如下: name欄位: age欄位: gender欄位: address欄位: Elasticsearch分別為每個欄位都建立了一個倒排索引。比如,在上面「張三」、「北京市」、22 這些都是Term,而[1,3]就是Posting List。Posting list就是一個數組,存儲了所有符合某個Term的文檔ID。 只要知道文檔ID,就能快速找到文檔。可是,要怎樣通過我們給定的關鍵詞快速找到這個Term呢? 當然是建索引了,為Terms建立索引,最好的就是B-Tree索引(MySQL就是B樹索引最好的例子)。 我們查找Term的過程跟在MyISAM中記錄ID的過程大致是一樣的 MyISAM中,索引和數據是分開,通過索引可以找到記錄的地址,進而可以找到這條記錄 在倒排索引中,通過Term索引可以找到Term在Term Dictionary中的位置,進而找到Posting List,有了倒排列表就可以根據ID找到文檔了 (PS:可以這樣理解,類比MyISAM的話,Term Index相當於索引文件,Term Dictionary相當於數據文件) (PS:其實,前面我們分了三步,我們可以把Term Index和Term Dictionary看成一步,就是找Term。因此,可以這樣理解倒排索引:通過單詞找到對應的倒排列表,根據倒排列表中的倒排項進而可以找到文檔記錄)

 

 

WEFV2626EFCEYYYB15VEF

 

 

 

文章來源取自於:

 

 

壹讀 https://read01.com/QAG7885.html

博客來 https://www.books.com.tw/exep/assp.php/888words/products/0010346149

如有侵權,請來信告知,我們會立刻下架。

DMCA:dmca(at)kubonews.com

聯絡我們:contact(at)kubonews.com


烏日中分直長髮推薦髮廊大甲剪壞頭髮修復專業剪髮推薦髮廊太平洋SOGO附近挑染顏色襯膚色專業剪髮推薦髮廊外埔美式風格的質感男仕理髮推薦髮型設計工作室
石岡中長髮造型推薦髮廊 台中北區兩側漸層髮型上班族染髮推薦髮廊 台中剪髮燙髮推薦新光三越附近髮根不好剪推薦染髮髮廊 豐原韓系厚瀏海學生染髮推薦髮廊 台中Dcard燙髮推薦大里羊毛捲髮專業剪髮推薦髮廊 太平洋SOGO附近雙色全染 台中南屯染髮推薦沙鹿染髮有助美白膚色專業剪髮推薦髮廊 台中西屯韓式燙髮專業染髮燙髮髮廊 台中哥德式護髮染髮推薦

arrow
arrow
    全站熱搜

    優惠情報 發表在 痞客邦 留言(0) 人氣()