我很激动,因为我发现:世界上还真有“21天学会C++”的方法。**
下面是一个《Teach Yourself C++ in 21 Days》的流程图,请各位程序员同仁认真领会。如果有必要,你可以查看这个图书以作参照
看不懂的同学
可以继续向下看,
下面是中文翻译版。
我是一颗恒星
我很激动,因为我发现:世界上还真有“21天学会C++”的方法。**
下面是一个《Teach Yourself C++ in 21 Days》的流程图,请各位程序员同仁认真领会。如果有必要,你可以查看这个图书以作参照
看不懂的同学
可以继续向下看,
下面是中文翻译版。
豫东方言商丘话
有一种关心叫:你咋咋啦?
有一种委屈叫:我咋咋你啦?
有一种惊讶叫:我类乖乖!
有一种不耐烦叫:你到底想咋咋吧?
有一种不甘示弱叫:咋咋!!
有一种问候叫:这一绷儿咋样儿?
有一种讨厌叫:你咋嫩不稀罕人哎!
有一种威胁叫:你给我招捂咯点儿!
有一种莫名叫:你弄啥家使来?
有一种舒服叫:得类很!
有一种失陪叫:先过几啦!
有一种迷茫叫:zua啦?
有一种愤怒叫:恼类慌!
有一种休息叫:歪一会儿!
有一种直率叫:实诚!
有一种幼稚叫:跟小孩尚!
有一种等待叫:先白慌类!
有一种畏惧叫:吓类合撒!
有一种不该喝的酒叫:猫尿!
血虎得====壁虎
面面呼得===蝙蝠
马嘎得====喜鹊
小小虫===麻雀
扁嘴得—-鸭子
木伏—–梳子
马可都得—–蝌蚪
赖嘟—–蟾蜍
马扎得—–可以合在一起中间带绳的板凳
麦了—-蝉的一种
河马—–青蛙
屋后——是指家的后边
鸡鸟得—–蝉
爬蚱—–幼蝉
啥家使—什莫东西
kài蛤蟆—捉青蛙
莫即了–最后
裤叉得–短裤
克朗得-骨头架子
洋火–火柴
护弄人、却人–骗人
决孟得—-感觉
出不出—-缩水否
门楼得—-门框
扑拉蛾得—-飞蛾
厥得—-木桩
憋勒慌—-闷
坷拉—-石块
秃爪得—-蛐蛐
哦(OU)—-牛
洋车子-自行车
洋油–煤油
一个半劲–不停的干什么
装孬–耍无赖
佛瞎话–说荒话
孬种、半扶(熟)—骂人的话
不惊喜–不聪明(傻的意思)
前个-前天
清恼起来–早上
胡吊乱、跟得乱、跟得砝(FA)-没规矩等
汗褂查得~~衬衣
义得~~肥皂
得劲~~舒服
梭皮—-头皮削
sei—-谁
气刮得—-烟火的一种
闸皮–土气
傍灰—灰尘多
到明儿—以后
黄晌--下午
毛得--厕所
夜个--昨天
小小得—–小男孩
膈捞——-角落
打鼻:刺鼻。
愿意:祷告。
灵:灵性。
泥洼子:泥潭。
护犊子:原意大牛犊呵护小牛犊。
车把式:赶车的。
执事:总指挥。
细粉:粉条。
礼条子、刀头:长条的猪肉。
见过礼:行过礼。
封了钱:给了钱。
大车:牲口拉的四轮木车。
火煤子:草纸。
盖头:盖在头上的红布。
搽:摸。
周周正正:端端正正。
簸篱子:用做隔墙的高粱秆织的簸。
担待:原谅。
咋:怎么。
恁:你们。
秫面:高粱面。
就:配着吃。
叽牛子:知了。
当门:中间的一间。
爬蚱:知了的前身。
恁:那么。
茅房:厕所。
脚脖子:脚踝。
一拃:五寸。
拖车:四腿朝上的木制农具。
认:愿意。
中:行,可以。
钱鞳子:装钱物的小布袋。
土垃:细土。
亏:冤屈。
闲书:指小说。
先生:医生。
一节子:一节段。
串门:到别人家去玩。
白:别,不要。
不得法:不舒服。
垡子:犁好后,还没有种庄稼的空白地。
略黑:天刚黑。
三四指:三四个手指,约两寸。
谷秸瘩:谷根。
一季子:一个季节。
八薄:八根绳子织的簸。
激灵:因惊吓而猛然一动。
睡的死:熟睡。
行行好:做做好事。
碓窑子:石磙一头挖了洞的搉杂粮的石具。
搉:往下砸。
碓碓:安了木把子的圆石头。
箩床子:两根平行的木板。
秫靶子:高粱头做的小扫帚。
瓢:半个葫芦。
洼着脊子:弯着腰。
揳:砸。
向口:方向。
拼对:拼凑。
老师儿:师傅。
气:气味。
劳盆:钻了小孔的小瓦盆。
大梗:粗绳。
搭帮:凑伙。
急:困难。
红车子:木做的独轮车。
靽绳:常为拉车用的绳。
大:父亲。
今个:今天。
明个:明天。
福大命大造化大不中:不可,不行。
主儿:人。
悠:串,转。
家里:老婆。
女人:妻子。
先生:医生。
细粉:粉条。
被子:用糊涂把几层不粘在一起。
白眼:不放菜的面条。
背筐:装草的大筐。
中蒙:中吗。
待:在。
仁彩:漂亮。
饶:白送。
瀪蛋:下蛋。
沤人:吵闹人。
端上:上面。
够:伸手拿东西。
主贵:金贵,贵重。
木杓:木桶。
挈:逮。
劙:划。
半大橛子:年轻小伙。
仁彩:好看。
出门子:出嫁。
迎喜:结婚。
大:叔。
怪:挺。
刁:懂事,精明。
花布机子:棉花卷成的长条。
落子:用来缠线的四框木具。
作假:谦虚。
菜修子:钻了洞的铁皮。
作心:胃里不舒服。
小铺对子:铺在下面的被子。
拨支:摆弄。
塌秧:即将干枯。
官:官中,公共。
平活:平安。
不是:不对。
谷个子:谷子梱。
瓢半嘴:乌鸦嘴。
碾转:用磨磨的麦仁。
沏猛子:凫水,扎猛子。
抄:迈。
破套子:旧棉花。
使头:撞头。
跑反:逃匪患。
打地磙子:比石磙细长。
墹:根基。
堆:坍塌。
泥机子:小板凳样的木鞋。
瓤:软。
花卷子:一层杂粮面,一层麦面卷做的馍。
光:只。
溜地搬:原指没有根基直接打墙。
松劲:寂寞无聊,没有兴致。
面叶子耳朵:软,怕老婆色。
破五:正月初五。
色:虱。
五伏:五代。
篓角子:肩顶草帽。
伸头戳屋:东张张望。
眼巴巴:可怜巴巴。
鲜:富足。
扑拉:用手摸扫。
狗不及:烧的粉芡,因太热狗不敢吃。
当误:端午。
饶:另外再无偿多给些。
尸把子:巫婆。
一势:一帮,一派。
揳打:抖动。
两挎子:两枝。
大油:猪油。
杓:桶。
咕哝:蠕动。
凿:弯了手指打。
奋:生:下崽。
串化肥:施化肥。
一扇子:半头猪。
能:聪明。
拖:两只胳膊伸直为一拖,约五尺。
主贵:珍贵。
小小虫:麻雀。
拍子:麦秸编织的尖顶的圆形蒸馍锅盖。
鲜:松软。
掉底:露底。
打渣子:开玩笑。
别干大:别开玩笑。
马虎:凶,不论理。
走了:死了。
仲米:婴儿吃用的东西。
老师儿:师傅。
抠挤:吝啬。
泼辣:开放。
泼泼辣辣:健健康康。
悠:扇、打。
哈:轻呼。
摔轱辘子:摔倒。
喳喳:吵叫。
该这个劲儿:该这个样子。
附路:柏油外的土路。
照:瞄看。
摽:较劲。
搂台:拥护捧场。
瓤子:皮里面的芯。
情:只管、尽管。
老好好:老好人。
镇压:枪毙。
兴:狂傲。
不如是:不如意。
拉拉呱:聊天。
眼角食:斜眼看着你吃。
堆:堆放。托放:发放。
不胜人:不如人。
谷堆:蹲。
拉拉呱:闲聊。
不经心:不吸取教训。
丧数:祭奠用品。
该:欠。
硌硬(胳应)
意思是说心里不舒服。写做前面的硌硬,让人想到童话里公主睡床上的那棵蚕豆,或者人体中暗种的各种“结石”,隐隐不爽。这词在河南话里好象都通用,加了括号里的,我改做胳支的胳,是因为在豫东方言里,是读作一声的,听起来有点象猫抓得不安稳。
例句:你别给我说普通话,我听着光胳应。(嘻嘻,这是同学宋小玉打电话给我的通牒,说家乡话)
枯楚
其实对应的就是普通话的皱纹。那个枯字,我想大致是不错的,人老了,都会风干了去。那个发chu音,写做哪个,看起来都有点不象原配,没办法了。豫东方言在发这个音时,语音是重音向下后坠的,让人想起那些折皱都是一堆提不起的岁月年轮。
例句:满脸枯楚。。。
抢亮(强梁、强粮)
是说某些人的行为特征,干嘛都爱争个先,稍具贬意,是那种有点自私霸道的不管不顾。我写做抢亮,是有感豫东的火神阏伯台,为黄帝子孙最早保存火种,在中国文明史发展的意义。有可能吗?算我瞎想罢。括号里的强梁,大家都知道,稍早些的强盗山贼叫这个。以前都农业社会,我疑心强梁也许从抢粮化过来的。
例句:这人干啥都抢亮。
会过
意思是说会过日子,精打细算那种。这个词,就是典型的河南方言的尽在不言中的省略。很奇怪,河南话中没有那种叠字多语音的形容词,都是干撅撅的土坷拉(土疙瘩)味。想起来,小时候看街上的女人吵架,也是“你咋咋啦,我咋咋拉”然后加上一些祖宗八代的问候。
例句:这人可会过啦。
乱
这个字在豫东方言里,很有意思。它除却通常意义上说的混乱的状态。一般还做动词用,有“玩闹”、“逗趣”的意思。这个字也是极具河南话特色的简省,一个字把玩闹过程后面可能的严重后果都一字道出。
例句:你别给他乱!
逞脸
经常是大人训小孩的话,调皮捣蛋。细究起来,同齐鲁大地(我听山东的朋友也说过)原来的文明教化有关,那就是大人都是端着的,崩着的,小孩子逞脸的犯上作乱,是在公共场合的出位。
例句:越有人越逞脸,看你能哩。(那个能,也是简化语意的,能干、本事)
肉
是指人做事慢,性子绵。河南话很多这种单字的形容词,纳闷。
例句:不招人待见(喜欢),忒肉啦!
沾
同河南话的“中”通用,好象只在豫东一带。有点象古语中的“诺”,OK啦!
例句:沾不沾?沾(可以译作这事中不中或者行不行,回答时也就一个字,沾、中、行)
咕叽guji
这个词很意思,翻成普通话,也就是蹲,现在也很少人说了。这个词我不知怎么写,写成这个词,是觉得这个词说得过程的动感,少有河南话翻成普通话多了一个字。
例句:你咕叽那儿!
今儿清岛,天还灰冷冷儿嘞,俺家里豆开始斜火着叫我去赶集。我又睡一木冷儿,才癔症个眼爬起来,抠抠芝麻糊一看,蚂嘎子、麦罢垛垛叫嘞血欢,日头地儿也不咋嘞毒,有点儿凉凉儿的。俺用胰子洗洗脸,吃个卷子,就点秦椒,喝一碗糊肚,瞅着夜儿个穿嘞褂子上都是尿津印子,干脆换个新布衫衩子,瞅着有点枯出,不拉不拉还是不板正,掂着熨斗熨几家伙,俺家里卷我:“带样子,烧摆嘞不轻!”
头先想着开小砰砰子儿嘞,日他祖奶奶,摇晚儿的油价铁贵了,骑个洋车子去伙啦。不豆少约轱轮吗?不豆蹾哒点儿吗?咋着也比地博崩快吧!临出门,我吆火她:“今儿个天不赖,连盖地、铺地都搭出来晾晾,潮乎乎嘞!” 出了古洞子,俺家西边是个大坑。坑里生了很多蚂鳖,骨涌骨涌嘞,硌意人。年时个蚂鳖钻进我肉里,一家伙打半天,腿都呼肿了,才连它呼出来。坑西边是个树林子,半大橛子的时候跟一班子老伙计经常搁这儿藏老木、摸爬蚱、打蝶佬。树上有老鸹,还有麻唧了子,不使闲地叫唤。面面糊子白儿嘞少,一般都是黑喽出来。前儿个看地仙的来看了,说这一片地要是摆治摆治一定会主贵嘞很。知道他是榷人的,我都想用砖头脏他。过喽树林子,是俺的自留地,点了二亩玉蜀黍,秧二亩红蕻。庄稼不好种,地里光长凄凄牙、老偶拽、马炮蛋子、蒺藜狗子,除串、花大姐、小吹吹儿成疙瘩连蛋嘞,小小虫儿也叨着吃,特别是地羊子,能嘞很,长虫也咳不住它,打药也不管护,成年年都那样。好比年时个麦罢吧,西北角一打闪,豆开始下冷子,下了一贺晌,都砸毁完了。
俺不慢夜眼了,赶紧赶集去,回来晚喽俺家里又该问俺弄啥家什去了,又该嘟噜俺“肉”了。你不知道,俺跟俺家里光肚小孩的时候一齐儿长大,起先她是挖陡脸,谁着“女大十八变”,她越长越支棱,我才耐烦她,寒不冷儿嘞我景她嘞!她长的排场,豆是口嘞很,净掂俺的耳道,拍俺的老木勺,掐俺的脖儿梗,反正天天枪使俺,她大贪为这事可某少熊她。白看俺家里脾气硌料,是个麦秸火,但人家有材料,不是个瓤茬,天天慌得蹄爪不使闲哩,引个孩子,泼嘞很;养了一群扁嘴子,嬎的鸭蛋吃不完;还用麦余子喂个老母猪,江了一窝子猪娃子。前些时她给人家送宗米去了,俺想着馍都快斯气了,就端到灶火里馏馏,烧锅时脸在锅地门被烤嘞红丢丢嘞,可俺连锅滚都不知道,一家伙鬻了;炒点菜吧,也是齁咸。为这事,她某少给我辖气,见天说我净抛洒东西、不沾弦,说嘞俺恁某成色,俺心里会得劲?给你说实话吧,俺是拿捏着哩,赶明儿俺也争争囊气,干一件利亮事,叫她也觉摸着她外先哩是个精喜人。俺可不是谝嘞,你说俺的想法粘不粘?
来到集上,激慌嘞一身汗,还差一点板倒。集上热闹嘞很,有点雀子嘞,有卖叫驴嘞,有卖齐火子嘞……这年头,连卖麦偶子药嘞都觅嘞有诱子。有个玩把戏嘞老斋公,支撒个手拿个弯溜硌帮嘞拐棍猴逗嘞可高,也不怕闪住腰喽。我买个抓钩,买个箩头,买一封洋火,看见人家卖的柿子稀溜溜的,也制了二斤半,回去煎柿拖子。
正打算回去嘞,看见俺一条杠给屎茅子根儿骨堆着,怀里斜着两棵甜秫秸不舍嘞丢手。俺这个一条杠家里吹响器,暄嘞很,就是东西啬刻嘞要命,豆这,还是个骚狐蛋,好烧包,天天喷嘞五马长枪嘞,实际上不照道嘞很。你看他,细麻长挑嘞,头梳的光牛牛嘞,给狗舔嘞样,穿个小坎儿,冻得浑身打核差。我想给他打离戏,他说:“别打渣子啦,俺今儿来给水羊牵羔,将将儿剃头嘞豁水,迎叶儿叫他豁一身。”我仔细一瞅,他浑身湿溜溜的,脚底下蹅嘞糊渣渣嘞,给王金豆借粮嘞样。我徐务这家伙央先讲究的很,某想到几天不见,咋成喇嘛筐了?眼看天都晌午错了,这家伙嗷嗷着还某吃饭哩,妥啦,碰上你这个半吊子算我霉气!我捞住他下馆子,他高兴嘞吃米带糖瓜嘞。要了一盘偶肉、一盘罗森豆、一瓶子大曲、两碗扁食,这家伙高兴嘞屁唧唧嘞。一开始他还作假,迟一小会儿豆逮住酒喝嘞吃喽喽嘞,拿着筷子搁盘子里核捞来核捞去,真迟耐人。
末及了,一瓶子也不楼他喝嘞,喝嘞晕头呱唧嘞,眼都喝迷瞪了,脸上油吃摸奶嘞,嘴上都是硌巴,肚末脐子翻吃着,哕了一地,磕囊人,这事可弄叉皮啦。他脊娘上还挂个不鳞,不老盖子也磕嘞血乎流拉嘞,走路叉拉着,出腰带也某找着,我给他弄个布个里儿系上了。我心想,这家伙要摔材坏喽,孩儿他姨还不愿意哩。他chua住我了,我也布不动他,掐着他的胳老肢儿都招呼不住,磕张嘞差一点叫车碓住,真百傻儿。他手里拨捏五毛钱,豆是不舍嘞坐票车,还血摽较,非坐我的洋车子,我某叫他坐,坐坏喽他又不包你。这货的文:“下一回我请你。”我心里说:你个妈糊蛋,我可不听你月白。我完亲嘞时候,你给我添箱豆添个裤衩子;俺家里放下,你豆kuai一笆斗子地梨子。哪个七孙争竞过你那点东西!你能嘞给猴样,转得不叫招,单百儿装喝多,要不是有亲戚,真想歇你几锤,你个老鳖一!白看你鸡猫狗不事儿嘞,我可不甩乎你!
眼看天都麻扎眼了,我忽上想起来邻居明儿个待九天还请俺打杂哩,就顺着官路一溜大八瓦回家了。磕磕张张嘞回到家,都吃罢剩馍了,月明地儿也明晃晃嘞了。
原文链接:
新浪博客
【1】把小概率事件当作颠扑不破的真理
北大毕业卖猪肉
博士毕业给初中辍学者打工
【2】我不懂,所以别人说啥我都信,万一是真的呢
孕妇不能用 Wi-Fi
碘盐/仙人掌能防辐射
【3】凡是自己不会的就是没用的
数学滚出高考 / 买菜需要微积分?
我又不出国,学什么英语?
【4】权威愚且坏,民间出奇才
这是官方为了不让我们知道 XX 而想出来的阴谋!
科学家花了 XX 年解决的问题,竟早已被他看穿!
【5】非黑即白走极端
XXX,一律死刑!
如果全世界所有人都 XXX,那还了得!
【6】企图挑起各种民族情绪来代替思考
不转不是中国人!/ XX 人都是傻逼!
美国人的结论会错?你也不撒泡尿照照自己!
但大多数都可以归结为以下 10 种之一:
【1】行善者必有恶行
“如果人不是你撞的,你为什么要扶他?”
“你别看 XXX 捐了多少钱,他只是为了逃税罢了”
【2】受害者必有罪过
“为什么这里那么多人,他不欺负别人,非要欺负你?”
“她穿得那么暴露,活该被色狼盯上”
【3】只有比他强才有资格评价他
“你说他打球不行,你行你上啊!”
“你们这些屁民有资格说他不好?我敢说,如果让你们坐在他的位置,早就吓尿了!”
【4】其实我心里早有答案,你不赞同我,一定有问题
“我最近生病了,医生告诉我最近不要吃 XX,但我很喜欢吃 XX,我该听他的吗?” “遵从医嘱吧。” “你这是在陷害我!网上说吃 XX 也没有关系啊!”
“我男朋友最近做了很多对不起我的事情 blablabla,我该分手吗?” “根据你的描述,他确实很不靠谱,不分手会有更大的损失” “哼,你是想趁机抢走他吧!”
【5】因为所在群体厉害,所以个体也一定厉害
“我们班向来男生比女生成绩好,所以别看你现在比我考得高,以后一定还是不如我!”
“我是城里人,他一个乡下人会比我优秀?别开玩笑了!”
【6】个体能力肯定都差不多,若结果有差别,必有蹊跷
“都是一个老师教的,为什么他考第一,你考第十?你一定没好好学!”
“我和他都申请了,我没申上,他却成功了,他肯定开后门了!”
【7】虽然我抢了你的,但你也不亏
“我抄你的文章怎么了?就你这点名气,我抄你是看得起你,还帮你推广了,你赚大了!”
“这东西反正你也用不上,不如送给我吧,你还能赚个乐于助人的好名声”
【8】你比别人好就必须无条件帮助他
“你成绩比他好那么多,为什么不帮他作弊?”
“你这么有钱,为什么不把剩下的钱都捐给穷人?”
【9】我都付出了,怎么可能没回报?
“我这么喜欢你,你好意思不喜欢我?”
“我都关注你了,你为什么不回关我,有没有礼貌啊!”
【10】这对你是举手之劳,为什么不做?
“你都已经带伞了,为什么不顺便帮我带一把?”
“帮我这个回答点个赞,你会死啊!”
【声明】转载为了收藏,侵权可删除。原文链接:
Mac 电脑上使用Xcode时间长了,磁盘空间越来越小,在明确没有其他大量文件占用空间情况下,磁盘也是不够用了。此处应该检查Xcode缓存占用的空间,一般会比较大(除非你经常清除Xcode缓存)。
先说结果吧:本人使用的 Mac mini 500G 磁盘,Xcode 的缓存竟然占去 256G 空间。
如下图:
下面是清除 Xcode 缓存的步骤:
(1)移除对旧设备的支持
影响:连接设备调试时,会重新自动生成
路径:~/Library/Developer/Xcode/iOS DeviceSupport
(2)移除旧版本的模拟器支持
影响:可重新下载了
路径:~/Library/Application Support/iPhone Simulator
路径:~/Library/Application Support/iPhone Simulator/x.x/tmp (模拟器临时文件)
路径:~/Library/Application Support/iPhone Simulator/x.x/Applications (模拟器安装的应用)
(3)移除Archives
影响:不可恢复;Adhoc或者App Store版本会被删除。建议备份dSYM文件夹
路径:~/Library/Developer/Xcode/Archives
(4)移除DerivedData
影响:可重新生成;会删除build生成的项目索引、build输出以及日志。重新打开项目时会重新生成,大的项目会耗费一些时间。
路径:~/Library/Developer/Xcode/DerivedData
(5)移除旧的Docsets
影响:不可恢复;将删除旧的Docsets文档
路径:~/Library/Developer/Shared/Documentation/DocSets
本人亲测了(3)和(4),不影响 Xcode 任何使用。以下是步骤截图:
首先,进入到对应目录(直接进入找不到)
找到对应目录之后,直接删除到废纸篓,还需要彻底删除。此处使用的工具 Dr.Cleaner 进行废纸篓清除。
最后是彻底清除之后的磁盘容量数据,这下,清爽多了。
PS:因为需要清理的磁盘空间实在太大,清除时用了很长时间。
近来做了有关抓取网页正文内容(含正文中图片)的功能,这里小结一下。
服务器端语言:PHP
已知:源文章的 URL
使用 PHP 内置函数 file_get_contents 或者 CURL 方法直接获取 URL 对应的网页源代码。
这两种方法的使用都很简单,此处不展开讲。注意 CURL 需要模块开启。
问题:可以提取到大部分网页源代码,但是同时也提取到了页面上的其他信息,例如广告、侧栏、通用顶部、通用底部、用户评论等等“噪点数据”,我们其实需要的是“原创文正的正文部分”,不需要其他乱七八糟的内容。
此时,这个源代码就需要进一步处理,使用普通的正则匹配不可用,因为网站内容格式千差万别。如果只是提取固定网站或者有限几个网站的内容,单独进行正则匹配也可凑合使用。这里要介绍的是一种通用的方法,不限网站个数和内容格式,适配几乎所有内容类的网站。
此处需要一个算法,把已经提取到的内容源文件处理一下,计算出正文部分内容(含图片)。
此方法叫做:Readability,一个开源的提取网页正文内容的类。Readability 是一个很不错的实现,它通过遍历Dom对象,通过标签和常用文字的加减权,来重新整合出页面的内容。
JS 版本的 Readability 是最好用的,它可以直接在浏览器完成分析,于是用户还可以人工对分析出来的内容进行修改和校正。
由于 Readability 解决的需求很通用,于是其他语言的程序员纷纷移植了该算法。
PHP 版本 https://github.com/feelinglucky/php-readability
Java 版本 https://github.com/wuman/JReadability
Node 版本 https://www.npmjs.org/package/node-readability
本人就是使用了 PHP 版本的。只是需要与自己的具体业务相结合,需要自己再修改即可,核心算法不变。
这个方法很有效,做内容聚合类的项目很适合(注意版权问题)。
为什么有特殊方法?
因为有些网站有版权保护意识,增加了一些措施防止原创内容被盗取。通常都是图片防盗链,也有正文文字也防盗取的。
此处举2例。
微信公众号文章目前数据量就不用说了,发的人多,看的人超级多,不乏一些优秀的原创。
它这个是要是图片防盗链。提取内容没有问题,但是所有的图片都被防盗链机制过滤掉了。
解决方案:
例如,其中一篇截图:
下面对应的图片部分的代码为:
<img data-s="300,640" data-type="jpeg" data-src="http://mmbiz.qpic.cn/mmbiz/9aMpMo0Xap52pCAdiaicq59bbawuXKt0Epws5Qc845SIgM059HHuBIkYpUzl9zUtLLjgwvKjwCkf7VGW6buZAIXQ/0?wx_fmt=jpeg" data-ratio="1.5" data-w="" src="http://mmbiz.qpic.cn/mmbiz/9aMpMo0Xap52pCAdiaicq59bbawuXKt0Epws5Qc845SIgM059HHuBIkYpUzl9zUtLLjgwvKjwCkf7VGW6buZAIXQ/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1" style="width: auto !important; visibility: visible !important; height: auto !important;">
其中,src 中的数据是懒加载的同时防盗链,在当前位置到达浏览器窗口时才加载(使用了JS),所以如果直接获取源代码,所有图片属性 src 都是指定的防盗链的静态图片 URL,不是图片的实际 URL。
但是,观察发现,图片实际 URL,已经包括在属性 data-src 中,同时返回了(方便 JS 处理)。
因此,我们在这里替换一次,把所有的图片属性 src 的值替换为图片实际 URL(即 data-src 中的值)即可。
$text= preg_replace("/data-src/ie", "src", $text);
之后,按普通方法继续处理。
科技媒体36氪文章的保护意识更强,直接抓取,别说图片,连正文文字都获取不到。
这里引用一下 V2EX 上的一篇文章的说法:
本人使用 PHP 的: file_get_contents 和 curl 函数都未曾获取到。就认真研究了下 36 氪的正文加载过程。
看了一下,它应该是使用 js 加载的正文内容。
如果禁用 js 调试,正文就没有内容;否则,就可以正常显示。但是查看了下所有的 js 文件也没看出来头绪,如果使用“网页另存为”本地文件,再用浏览器打开也是没有正文。
是不是使用了什么加密技术来获取正文(为了防止爬虫)?各位探讨一下
就是这个意思,我也遇到了同样的问题,不过我怀疑:它的正文时动态加载的。
看了之后,我又去仔细研究了下,得出结论:
因为它的正文内容的确是使用 JS 动态加载的。
幸运的是,实际的数据也已经提前随源代码返回来了,只是没有经过 JS 处理,浏览器中不可见而已。
参考截图:
经过仔细观察发现,可以获取 html 源代码中的 data-dom-id 值为 App-react-component-0 的属性 data-props 的值,就是包含正文内容的 JSON 格式数据。
此处可以使用 DOM 获取,也可以使用正则匹配,本人使用了正则匹配。
正则表达式:
data-dom-id="App-react-component-0"([\s\S]*?)data-props=['|\"]([\s\S]*?)['|\"]\s+data-trace=
匹配结果的第2个元素即为包含正文数据的 JSON 格式数据。
之后,把 JSON 格式数据转换为 数组,即可进一步处理。
preg_match("/data-dom-id=\"App-react-component-0\"([\s\S]*?)data-props=['|\"]([\s\S]*?)['|\"]\s+data-trace=/i", $source, $matches);
$matchesstr = htmlspecialchars_decode($matches[2]);
$matchestarget = json_decode($matchesstr,true);
此处注意,转移实体的反转义。否则 JSON 解码函数结果为空。
以上,就是已经用到的方法,总体思路就是:
直接获取 –> 间接获取 –> 正则匹配 –> 替换成可处理格式
不过,这些具体方法本身可能需要随时修正的,具体就看源网站的规则什么时候修改,修改为什么样子了。
掌握核心思考方法和处理机制,任其万变,不离其宗。
跟朋友以及网友交流多了,发现大众对于健康常识的认知已经糟糕到「非常可怕」的地步了。作为一个现代社会人,应该有一个朴素的对健康常识的认知。比如,至少应该知道并理解如下几条常识:
1.你从小就听到的那句「偏方治大病」就是屁话,不可能治大病。倒是可能导致大病。
2.没有所谓能「大补」的东西,冬虫夏草人参鱼翅燕窝铁皮石斛阿胶都不管用,吃的越多可能死的越快,个别的东西甚至改变了中国历史进程,比如冬虫夏草,你懂的。
3.中药副作用并不小,相反,倒是因为成份不明药效不清等一堆原因导致的副作用会非常大。 而且,中药并不便宜。更糟糕的是,很多中药里面经常勾兑剂量不清的西药成分,风险更大。
4.身体没必要进行所谓的「调理」,要多锻炼。懒也要锻炼。比如我懒我就承认自己懒,但我不会幻想吃什么东西会让自己骨骼清奇。
5.没有所谓的酸性体质,所谓的「体虚」「体寒」「宫寒」「肾虚」之类的说法也都是扯淡,同样,人体也不需要经常「排毒」。
6.光看药品说明书也没用,你还有必要知道药品之间的相互作用以及药物的最新警示,而这个除了「丁香医生」这个 App,没人能告诉你。你懂了这个,就能降低很多风险。
7.无需你鉴定,上一条是广告。但不会害你,产品也不收费,产品里也不卖药,也没广告。
8.自己会用搜索引擎查个药找一下疾病信息当然也算是一种能力,但不值得炫耀,因为很多人就是这么被骗的。尤其不要通过百度这样的搜索引擎找医院。
9.产品名字里包含「红外」「磁疗」 之类的各种家用理疗仪器、床甚至枕头都是骗人的。他们不可能对你的糖尿病高血压心脏病…有任何效果,除了心理安慰。花那么多钱买个心理安慰是不是太贵了?
10.女人准备怀孕前不要去找中医进行「调理」。有孩子的,如果是自己的亲生孩子,让孩子远离中医药。不是自己亲生孩子,出于人道考虑,也要远离中医药。
11.年轻人有青春痘别怕,过了一定年龄就好了,我当年肯定比你严重多了。别因为这个就去服用一些来历不明的中药,很多治疗青春痘的药物都含有激素,而且过量。
12.警惕「标本兼治」,这只是一句广告语罢了,如果有卖药的跟你说能标本兼治,基本是骗子;如果有医生跟你吹嘘标本兼治,基本是忽悠。
13.警惕电视上任何「健康养生」节目的所谓「专家」建议。别信电视上医药广告里的任何代言人,尤其是电影电视以及相声演员代言的医疗健康类东西,都是骗子。
14.听到对某种疾病的疗法中包含「攻克」之类的字眼要警惕,骗子。我们有生之年都很难遇到一个疾病会被攻克,江湖游医无法攻克任何一个疾病,他们只会攻克你的钱包。
15.如果你是中老年人,那么你更应该相信你的受过现代教育的儿女们给你的医疗和健康类的建议,而不是相信你邻居二大妈七大姑八大姨的。
16.如果你是中老年人,跟你同龄的亲戚朋友给你推荐的所谓「神医」,离他们远点。感谢他们的好意即可,但别信他们的。有些人是好心眼儿,但是在这个事情上,蠢货太多了。
17.一些所谓的藏药、苗药号称有神奇功能的,别信,别因为那地方神秘就觉得真管用。顺便说一下,西藏现在人均寿命也才 68 岁,全国人均寿命是 76 岁。
18.如果以上任何建议你听着不顺耳,那都是你错了。如果觉得我说的不够严谨,这倒是有可能的,我们可以探讨一下细节。
19.转基因并不可怕,你已经吃过很多转基因的东西了。如果你还是不放心,那么我告诉你,有些中药也是转基因的,你怎么办?
20.还有很多… 我想起来再说。
会翻墙+ Google + 英文搜索 + 像阅读中文一样顺畅阅读任何英文书籍、网站,只要做到以上几点,就足够获得比绝大多数英文不好或偷懒或没能力翻墙的中国人多得多的信息了。
不过吧,真正要学会比别人多的知识,还是靠深度学习,比如专门读几本大块头的系统性的书籍。
当然,还是推荐看英文的书,人类的知识绝大部分都是英文写的,英文创造的。中文世界里的知识,绝大多数都是二手货,数量远逊于原版,质量也经常会稍差。由于各种原因,太多的英语知识即使可能对我们极其有用,但是永远不会被翻译。
—————————–以下才是重点——————————————
授人以鱼不如授人以渔。
**“恶魔奶爸”提供了很多英文书清单,我就不补充了,我来分享一下如何找到这些高质量的英文知识来源的经验吧。我在此给大家举几个实际的例子,说明如何利用英文搜索+Google,学习到比中文世界质量更高的有用的知识,希望能给大家一点点启发。
或许这些例子都很微不足道,但如果你掌握了其中的思想和方法的精髓**,并加以实践,平时多多思考,必将能够大大发挥英语和Google作为信息工具的威力,always learn from the best, 实实在在提高你的信息获取能力、知识水平乃至生活质量,让全人类的知识为你服务。
1.蚊香的危害到底有多大?去年夏天某天,舍友在宿舍点蚊香。我突然想起看到过说蚊香有害的文章,其实并不在意,但还是想研究一下。于是上网搜索,中文世界里能搜到一些,但大多都是很简单的描述,明显不够科学。于是用英文搜索蚊香,然后就在世界卫生组织官网找到一个文档,http://t.cn/zHKgxxW这是WHO在儿童健康与室内空气健康方面的培训材料,第39页关于蚊香说,“Mosquito coils may represent a serious potential threat to children’s health. Prolonged use has been associated with increased incidences of asthma and persistent wheezing in children“。WHO建议不要在有儿童的房间里使用蚊香,因为蚊香产生的微毒,足够影响儿童的呼吸器官发育,会增大儿童患哮喘和持续喘息的几率。WHO引用了一篇马来西亚大学和美国某大学联合做的一篇论文,用实验证明蚊香的伤害。我找到论文英文原文,浏览summary和大概全文。至此,我对蚊香的具体危害有了详尽的掌握,我以后有孩子的话,是不会给TA用蚊香的。
2.近视手术到底是不是有害?最近有朋友跟我说,考虑要不要做近视激光手术。我提醒她,好像听说这种手术挺危险的,但是具体什么危险我却说不上,中文网络里该话题的讨论也很混乱,因为很多医院都在做,利益相关,他们的医生出来说的话不一定可信。于是我建议她用英文搜索,看看美国FDA对该手术是何态度,美国的医院是否也在普遍做。Google搜索”laser eye surgery fda”,就能找到FDA官网关于激光眼睛手术的页面LASIK,上面有视频介绍了大概的风险,以及全面介绍的小册子,帮你判断是否适合该手术。该网站上还列出了经FDA批准的眼睛激光手术设备列表。有了这些信息,在考虑是否做手术时,就能清楚判断手术风险对于自己的意义。在确定哪一家医院时,就可选择拥有FDA批准设备的医院,而排除掉使用可能不合格国产激光设备的医院。
3. 在中国教育一个双语宝宝是否可行?正是由于我感受到了掌握英文的威力,所以这些年在考虑,如果以后有了孩子,应该要搞双语教育,让英语和中文同时成为孩子的母语。在中文世界里搜索双语教育,就会发现,相关的知识很少,而且各种声音观点繁杂,根本不知谁对谁错,大家都不够专业。在google英文搜索bilingual education,发现国外关于从小培养双语孩子的专业研究特别多。国内网络上经常有人会说,从小学两种语言,小孩会弄混的,甚至导致两种都学不好,而研究表明这种观点是错误的。所有小孩都可以学习两种母语,学习模式也可以是多种多样的。参见麦吉尔大学语言学家的研究(A Short Guide to Raising Children Bilingually) http://t.cn/zRcGLiU 这篇专业文献不仅会告诉你双语宝宝是可行的,还会告诉你有哪些常见模式,教育的基本原则有哪些,等等。他们甚至有专门的一本杂志 Multilingual Living Magazine,各种权威的有关双语教育的文章和讨论。中文世界里的相关知识,要么专业晦涩,要么太业余,很多都是家长试验性的在自己搞,然后分享一些经验。毕竟中国人搞双语教育是近些年才出现的事物,相关知识积累难免较少。
4.爱国主义在别的国家是如何定义的? 曾经有段时间,央视关于“爱国”的讨论非常火热,各种声音也是众说纷纭,有人爱国又爱dang,有人民族主义情绪强烈。我当时突然在想,或许跳出中国这个框框,参考一下他山之石,或许会有新的启发。于是我找到了一份美国教育部在一份给家长的小册子里关于爱国主义的非正式定义,“爱国主义是指对国家的热爱和忠诚。它包括维护奠定国家基础的民zhu理念,并期望民xuan官员同样做到这一点;尊敬和遵守国家的法律,维护国家的旗帜和其他象征。爱国主义还包括承担合格的公民应有的义务,比如努力了解国家事务、投piao、志愿服务,以及在战zeng时期为国家服务等。”在此,并不是说美国对爱国主义的定义就一定对,或者比我们好,而是,有很多事情,放眼全球能够更好地帮助你看清脚下。不识庐山真面目,只缘身在此山中。很多时候要了解我们的国家,跳出一点距离再去审视,才能更清楚看清现状。
5.中国的英语教育到底是用力太多还是用力不足?前段时间北京高考改革把英语降分至低于语文,引起了广泛讨论。有人认为外语占比不能高于母语,有人觉得英语教育其实还不够。这个时候,继续局限在国内的环境里去争论,很难得出有建设性的结论。我认为,讨论英语是否应当继续在高考中占大比分,必须放在全球化的视角下去思考,参考日本、韩国、台湾等地区的做法,综合中国的实际情况予以考虑。于是我搜索了一些关于日本、韩国和台湾的大学入学考试的资料(虽然英语资料不多,但是还是远多于中文),看看日本的高考英语占比多少。结果发现,在日本全国大学入学考试中,英语所占分值为250分,高于日语所占的200分。另外我还在日本的英文媒体上搜索到新闻,日本执政党自民党2013年4月向首相递交教育改革议案,要求日本大学将托福(TOEFL)考试作为大学入学和毕业的门槛,提升学生英文水平,该议案甚至还提议,要求所有日本公务员都必须达到托福的一定级别,否则就不予雇佣。参见LDP panel presents proposal on TOEFL prerequisite for universities。在韩国,外语教育更是很受重视,高中生不仅要学习韩语、英语,还要选修二外如中文、德语、西班牙语或法语等。环视全球,日本、韩国、台湾及欧洲,在英文教育的重视上都呈现加强态势,理由多是为了培养全球化的人才。相比之下,中国的做法,更像是在倒退。以上这些资讯,中文世界里是几乎没有的,因为日本、韩国教育改革之类的事情看起来跟中国也没啥关系,没有媒体关心的。当你在看国内英语高考改革新闻的时候,在所有媒体都局限在中国范围内讨论问题的时候,如果你能够想到参考国外,并利用英语和Google有效搜寻信息,你就能够获得不一样的视角。
6.各种育儿知识。我现在虽然还没结婚生孩子,但是一直对教育很有兴趣,所以也会关注教育方面的知识。在科学育儿方面,由于历史原因,国内还有很多不科学的育儿方法流传,一般人、甚至是一些医生、心理专家,也会陷入其中。这时候,最好的办法,就是参考外国人是怎么做的。比如睡眠训练是否科学、如何培养孩子的独立自主能力等等,很多现代教育理念都源自于西方,有些家长希望拥抱这些理念,却找不到足够多科学的材料学习,只能在网上找一些支离破碎、经过各种加工、筛选甚至扭曲的知识看,难免会掺杂一些不合理的东西。
7.各种医疗卫生知识。就像香港卫生署禁止VC银翘片的新闻一样,如果香港媒体没有报道这条新闻,如果新闻没有传到国内,如果萱萱禁止了该新闻,你可能还会在不知道风险的情况下,给孩子服用VC银翘片。推而广之,很多国内的药品、医疗技术,真假参半,普通人、甚至很多医学院的学生都没法判断是否安全可靠。这个时候,如果你英文搜索水平高,去外国网站上查查,没准就能找到关于某个疾病领域的最新进展,从而判断国内一些医院宣称的“先进技术、先进药物”是真是假,甚至是否已经在实验中被证明有害、无效,甚至是否已被明令禁止。
其实推广开来,国内很多行业或生活中的不科学做法、骗人的东西,我们都可以利用强大的信息获取、分析和对比能力进行甄别,从而保护自己的利益。(说来可悲,这些工作本该让更专业的人士来做,可由于国内监管不完善等原因,很多时候只能消费者自己去做庞大的鉴别工作。)
8.专业领域的深度学习(这是最后一条,不能再列举了。。。)
专业领域的学习,自然是要靠系统性的深度学习才行。不过,由于很多行业的知识更新速度很快,中文的教材等经常会落后于产业或前沿,或者一些经典英文教材由于版权等原因没有中文版。大学生在学习到一定深度以后,不妨去国外顶尖大学的同专业的主页,看一看他们本科或研究生的课程安排,这样做会有助于抓住专业体系中的重点或者前沿。还有一个特别好的方法,是一边在中国的课堂上学习,一边在Coursera、Udacity等公开课平台上看对应的国外知名大学的课程。
学习专业领域知识,不仅要埋头苦学,而且要聪明地学,有方向地学。适当参考国外最新专业体系设计和教材,应该是每个中国大学和大学生都应做到的。可现实是,中国的一些大学,明明有全世界认可的高质量教材不用,非要用自己老师的粗制滥造的教材。作为学生,改变不了这样的现状,但不能因此被限制,而是要去利用互联网,跨越障碍,追求最好的教学资源,要学就学最好的!有些经典教材没有中文版,就上Google搜教材名+pdf,在iPad上或者自己打印出来看。
最近几年,Coursera和Udacity等平台的课程数量、种类和质量进步极快(Check it out now!),相比5年前已完全不在同一级别。网易公开课等中文平台,能够翻译的,只是这些课程的十分之一甚至更少。其实很多Coursera课程都已有英文字幕,难度并不太大。现在的中国大学生,触手可及的潜在资源,比10年前甚至5年前的学长们,都已经好太多。如果你仍局限在自己的大学和中文世界里,不去利用这些质量极高的材料,实在太可惜。
以上这些知识,都是在中文世界里几乎没有的知识,或中文的相关知识质量低下、没有权威靠谱的信息来源,或者像中医那样备受争议、毫无头绪。如果能运用英语和Google,在英语世界里遨游一下,或许就能发现更高质量的知识内容,更权威的专业研究,或许就能帮你理清思路,获得不一样的视角。
在遇到生活、工作和学习问题时,如果在百度上百搜不得其解,不妨试下用英语在Google搜索,适当参考英语世界的知识积累,让全人类的优秀知识、权威研究,甚至是外国网友的人生经验都能为我所用,为生活服务。比如我有段时间突然对性格分类感兴趣,INTJ、ENFP什么的,用英语搜索外国网友的讨论,就比中文的讨论要多。
在思考复杂的社会问题时,别人都在说“这就是国情,没办法”的时候,在看起来几乎无解的时候,不妨把社会问题放到全球化的视野中去思考和比照,参考发达国家是怎么处理类似问题的,思考他山之石,可否攻玉?
要拥有国际化的视野,不一定非要出国。充分利用互联网这个人类知识的宝库,多利用Google,增强搜索技能,既看中文,也参考英文的信息,经常思考比照,完全可以做到不出国胜似出国。
由于中国的发展阶段问题,很多国内的社会问题,都曾发生在几十年前的发达国家,别人已经吃到了苦头、总结教训并制定了应对的法律或制度,这时我们应该参考、借鉴。不一定非要照搬,但如果明摆着的经验教训你却偏偏拒绝学习,那就是自找苦吃了。还是那句话,不识庐山真面目,只缘身在此山中。学习英语不会让你谄媚外国,而是让你能够学习别人的长处,获得全人类的知识宝库,更好地了解我们自己的国家甚至为国家服务。
服务端配置:
这个实际上是看和远程sql server 2000服务器的物理连接是否存在。如果不行,请检查网络情况。
例如:
telnet 202.114.100.100 1433
1433是sql 2000对于Tcp/IP的默认侦听端口,也可通过”服务器的网络使用工具”来更改对于TCP/IP的侦听端口。通常这一步会出问题,提示:”……无法打开连接,连接失败”。如果这一步有问题,应该检查以下选项:
1、在配置侦听端口时,如果把”隐藏服务器复选框”勾选上了,则意味着客户端无法通过枚举服务器来看到这台服务器,起到了保护的作用,但是Tcp/ip协议的默认端口将被隐式修改为2433,在客户端连接时必须作相应的改变。
2、如果服务器端操作系统打过xp sp2补丁,则要使windows防火墙开放1433端口,方法很简单,在防火墙的”例外”选项卡中,点击”添加端口”按钮,添加相应的端口即可。
3、检查服务器是否在1433端口侦听。如果服务器没有在tcp连接的1433端口侦听,则是连接不上的。检查方法是在服务器的dos里面输入
netstat –an
(全称:network status – all numeric,以数字形式显示所有连接的地址和端口),在结果列表里看是否有类似
tcp 127.0.0.1 1433 listening
的项。如果没有,则通常需要给sql server 2000打上至少sp3的补丁。可以在服务器端启动查询分析器,输入
select @@version
执行后可以看到版本号,版本号在 8.00.2039 以下的都需要打补丁。这是Sp4的下载地址 (SQLServer SP4补丁下载) 。注意下载后,执行的时候是解压,要在解压后的目录中执行setup.bat才是真正的安装。
这时再做telnet测试,应该OK了。