Code杂谈 » JasonLe's TechBlog

Archive for the ‘Code杂谈’ category

curl分析请求耗时

December 12th, 2018

最近在和一个厂商对接，某个请求的响应特别慢，因此我就希望有一种方法能够分析到底请求的哪一步耗时比较长，好进一步找到问题的原因。在网络上搜索了一下，发现了一个非常好用的方法， curl 命令就能帮你分析请求的各个部分耗时。

curl 命令提供了 -w 参数，这个参数在 manpage 是这样解释的：

-w, –write-out
Make curl display information on stdout after a completed transfer. The format is a string that may contain plain text mixed with any number of variables. The format
can be specified as a literal “string”, or you can have curl read the format from a file with “@filename” and to tell curl to read the format from stdin you write
“@-“.
The variables present in the output format will be substituted by the value or text that curl thinks fit, as described below. All variables are specified as %{vari‐
able_name} and to output a normal % you just write them as %%. You can output a newline by using \n, a carriage return with \r and a tab space with \t.

它能够按照指定的格式打印某些信息，里面可以使用某些特定的变量，而且支持 \n 、 \t 和 \r 转义字符。提供的变量很多，比如 status_code 、 local_port 、 size_download 等等，这篇文章我们只关注和请求时间有关的变量(以 time_ 开头的变量)。

先往文本文件 curl-format.txt 写入下面的内容：

time_namelookup: %{time_namelookup}\n
time_connect: %{time_connect}\n
time_appconnect: %{time_appconnect}\n
time_redirect: %{time_redirect}\n
time_pretransfer: %{time_pretransfer}\n
time_starttransfer: %{time_starttransfer}\n
———-\n
time_total: %{time_total}\n

time_namelookup ：DNS 域名解析的时候，就是把 https://zhihu.com 转换成 ip 地址的过程
time_connect ：TCP 连接建立的时间，就是三次握手的时间
time_appconnect ：SSL/SSH 等上层协议建立连接的时间，比如 connect/handshake 的时间
time_redirect ：从开始到最后一个请求事务的时间
time_pretransfer ：从请求开始到响应开始传输的时间
time_starttransfer ：从请求开始到第一个字节将要传输的时间
time_total ：这次请求花费的全部时间

curl -w “@curl-format.txt” -o /dev/null -s -L “https://business.smartcamera.api.io.mi.com/common/device/preUpload”
time_namelookup: 0.004
time_connect: 0.016
time_appconnect: 0.151
time_redirect: 0.000
time_pretransfer: 0.151
time_starttransfer: 0.157
———-
time_total: 0.157
%

可以看到 time_appconnect 和 time_redirect 都不是 0 了，其中 SSL 协议处理时间为 0.151s-0.016s=135ms 。

http://man.linuxde.net/curl

No comments »

Posted in Code杂谈

Tags: Network

Java Executor 框架使用的思考

April 18th, 2018

最近在使用Java的线程池做一些线程频繁创建销毁的事情，我的目标是利用已有的云Queue服务，将我们的服务接入这个Queue，目前我们使用的是一个基于内存Queue的异步队列框架，这就导致当进程因为某种原因导致崩溃后，内存Queue中的数据全部丢失，这是我们所不能容忍的。

因此我们在云Queue上创建两个Queue，在处理高峰时刻将一部分数据导入backup queue中，当主 queue中的Message消费完毕后，主动去消费backup queue 中的数据。开始我使用一种按需分配的方式，即先使用Excutor创建一个pool后，只有一个线程去轮询主Queue中是否有数据，云Queue中有数据就创建一个线程加入到pool中执行，最后自到触发RejectedExecutionException，这个时候我将主Queue中的数据放到backup Queue中执行。

另外一种比较土的方案就是Server一启动，直接启动400个线程加入到pool中执行业务逻辑，长轮询主Queue是否有数据，有就去消费，没有就去消费Backup Queue中的数据。

从直觉上，大家都会认为第一种方案资源消耗会更优，但是在实际的工程实现中，必然存在设计和实现的折中，我的每个task执行逻辑会有多大五六个返回值，有的返回值需要将消息推送给用户，如果我按照第一个方案去做，那么必然有一刻处理峰值，会将大量的Message都导入backup Queue，只要进入backup Queue中后，就无法给用户实时推送消息，换句话说，消息就丢失了，虽然我很想用第一种方案去实现复杂逻辑，但是在实际的实现中会导致我的backup queue会分成很多种情况，这就导致实现复杂度和queue的复杂度提升更快。经过半个月的讨论，我终于敲定使用简单粗暴的方式去实现我的功能。

略

以上是我的一个吐槽。

https://blog.csdn.net/pfnie/article/details/52755769

No comments »

Posted in Code杂谈

Tags: Code杂谈 Java

elasticsearch 配置遇到的问题

October 7th, 2017

为了存储海量数据，以便进一步进行数据分析，调研了一段时间，elasticsearch是个不错的选择。
elasticsearch 是一个用于搜索领域的分布式数据库，基于jdk为jdk1.8.0_73以上。不同于mysql之类的关系型数据库，elasticsearch基于RESTful web接口需要使用POST/GET/DELETE/PUT来处理数据。我采用elasticsearch-py接口对数据库进行CRUD。不过在启动的时候，发现如下问题：

[2017-12-27T21:07:13,695][INFO ][o.e.t.TransportService   ] [node-1] publish_address {192.168.228.134:9300}, bound_addresses {[::]:9300}
[2017-12-27T21:07:14,005][INFO ][o.e.b.BootstrapChecks    ] [node-1] bound or publishing to a non-loopback or non-link-local address, enforcing bootstrap checks
ERROR: [1] bootstrap checks failed
[1]: max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144]
[2017-12-27T21:07:14,155][INFO ][o.e.n.Node               ] [node-1] stopping ...
[2017-12-27T21:07:14,468][INFO ][o.e.n.Node               ] [node-1] stopped
[2017-12-27T21:07:14,482][INFO ][o.e.n.Node               ] [node-1] closing ...
[2017-12-27T21:07:14,764][INFO ][o.e.n.Node               ] [node-1] closed

这个时候需要扩大虚拟内存堆：sysctl -w vm.max_map_count=262144

另外安装elasticsearch-head在5.x版本后需要借助nodejs服务，这一块配置安装比较繁琐，先要配置nodejs/npm/grunt。

npm安装:

curl https://npmjs.org/install.sh | sh
sh install.sh

如果出现 npm cannot be installed without Node.js. Install Node.js first, and then try again. 则需要安装Node.js

apt-get install nodejs 如果node.js版本过低，则需要升级

# 第一步：首先安装 n 模块：
npm install -g n
# 第二步：升级node.js到最新稳定版
n stable

node 环境安装完毕后安装 elasticsearch-head 所需模块：

git clone git://github.com/mobz/elasticsearch-head.git
cd elasticsearch-head
npm install
npm run start

配置完 elasticsearch-head，要在./config/elasticsearch.yml中打开注释,然后重新启动es。

http.port: 9200
# 跨域
http.cors.enabled: true
http.cors.allow-origin: "*"

参考:

https://my.oschina.net/kittyMan/blog/387512?p=1
http://orchome.com/489

No comments »

Posted in Code杂谈

Tags: elasticsearch

basemap 尝鲜

September 28th, 2017

去年做毕业论文的时候做统计的时候用过gnuplot，最近做数据挖掘和可视化，又发现matplotlib是一个比较活跃的绘图python库。通过matplotlib可以绘制散点图，柱状图，折线图。这些配合sklearn可以进行经典的数据挖掘。

最近老板给我一些gis方面的数据，先摸索一下数据分布，为以后的聚类做准备。开始我直接将GIS的经纬度scatter到二维坐标系中，发现没有地图做配合，看分布非常抽象。忽闻basemap作为matplotlib的一个子插件可以胜任该工作。

首先basemap可以绘制不同的地理信息图，包括blue marble 球状的、饼状的、二维地图等不同形式。我这里主要绘制折线图，所以使用plot就可以了。

import numpy as np
from mpl_toolkits.basemap import Basemap
import matplotlib.pyplot as plt
from datetime import datetime

map = Basemap(projection='mill',lon_0=180)
map.drawcoastlines()
map.drawparallels(np.arange(-90,90,30),labels=[1,0,0,0])
map.drawmeridians(np.arange(map.lonmin,map.lonmax+30,60),labels=[0,0,0,1])
map.drawmapboundary(fill_color='aqua')
map.fillcontinents(color='coral',lake_color='aqua')

只需要声明Basemap方法，声明投影方式即可，对于投影方式我挺懵逼的，不过我们把basemap下载下来，里面有examples，可以直接运行run_all.py,观察自己想要的投影方式，当然了最基本的经纬度概念还是要有，否则就无法选择我们想要的固定区域。merc就是绘制其中一部分地图的投影方式

m = Basemap(llcrnrlon=-100.,llcrnrlat=20.,urcrnrlon=20.,urcrnrlat=60.,\
            rsphere=(6378137.00,6356752.3142),\
            resolution='l',projection='merc',\
            lat_0=40.,lon_0=-20.,lat_ts=20.)

其中llcrnrlon，llcrnrlat代表left down的经度，纬度；urcrnrlon，urcrnrlat代表upper right的经度，纬度。以对角坐标值就可以确定一个唯一的视口大小。

附我做的航路图：

使用matplotlib只要记住绘制散点（scatter），折线（plot）基本就可以满足我们的需要了。

参考

http://matplotlib.org/basemap/users/examples.html

No comments »

Posted in Code杂谈

Tags: matplotlib

字符串乱码解决之道

January 5th, 2017

最近工作压力太大，blog也逐渐荒废，怎么也得写点东西了，要不说不过去。。。。。

Qt为字节流和字符串分别提供了QByteArray和QString两个类(还有QLatin1String等其他类，但这两个是最主要的)。当我们涉及到I/O时，比如读写文件、读写网络socket、控制台输入输出、读写串口… 操作的都是字节流，如果我们此时需要操作的内容是字符串，则需要二者之间的相互转换。在C和C++中，我们一般都是将 “Hello World!” 这种称为字符串。但是就目前而言，当我们提字符串时，一般是指一个Unicode字符串，其由一个一个的Unicode字符构成；当我们提字节流时，是指一个一个的字节。或许我们可以说，ANSI C/C++截止目前只有字节流，而缺乏对字符串的支持。另外各个编译器对编码的支持又严重不一， Qt为解决这个问题提供了QTextCodec。

QTextCodec * textc = QTextCodec::codecForName("GBK");
1.QTextCodec::setCodecForCStrings(textc);
2.QTextCodec::setCodecForTr(textc); 
3.QTextCodec::setCodecForLocale(textc);

QString 是不存在中文支持问题的，很多人遇到问题，并不是本身 QString 的问题，而是没有将自己希望的字符串正确赋给QString。很简单的问题，”我是中文”这样写的时候，它是传统的char 类型的窄字符串，我们需要的只不过是通过某种方式告诉QString 这四个汉字采用的那种编码。而问题一般都出在很多用户对自己当前的编码没太多概念。另外文件是有编码的，但是这种纯文本文件却不会记录自己采用的编码，这个是问题的根源。真的是 QString 乱码了吗？其实很简单的一个问题，当你从窄字符串 char* 转成Unicode的QString字符串的时候，你需要告诉QString你的这串char* 中究竟用的是什么编码？GBK、BIG5还是Latin-1。理想情况就是：将char* 传给QString时，同时告诉QString自己的编码是什么；但是QString 提供的成员函数，远远满足不了大家的需求，于是只有采取语句1的办法。

tr(“中文”);与QString(“中文”);一样，你必须告诉tr这个窄字符串是何种编码？你不告诉它，它就用latin1。于是所谓的乱码问题就出来了。如何告诉tr你写的这几个汉字在磁盘中保存的是何种编码呢？这正是语句2所做的。如果你的编码采用的utf8，可以直接使用trUtf8而不必设置setCodecForTr()。

对于语句3应该没什么好说的，在绝大多数情况下，我们在代码中应该都用不到这个函数(默认的system应该比我们所能设置的要好)。
下面讲一下关于编码转换问题:
QT中的QString内容使用Unicode作为文本编码。但是实际系统中通常采用的是其他编码，例如GBK，utf8等。为了便于兼容这些格式，QT中还设置了两个字符串类型：
QCString类: C类型字符串，必须以\0结尾，也就是中间不能含有\0. 例如GBK编码的字符串
QByteArray类: 中间可以含有\0.例如utf8编码的字符串

在设置下面的代码基础上：

QTextCodec *gbk = QTextCodec::codecForName("gb18030"); 
QTextCodec *utg8 = QTextCodec::codecForName("utf-8");
QTextCodec::setCodecForTr(gbk);
QTextCodec::setCodecForLocale(gbk);
QTextCodec::setCodecForCStrings(gbk);

1. UTF-8 转换 GBK

QString U2G(QString utfStr)
{
   return gbk-&gt;toUnicode(utfStr.toLocal8Bit());
}

2 GBK 转换 UTF-8

QString U2G(QString gbkStr)
{
   return utg8-&gt;toUnicode(gbkStr.toUtf8());
}

代码示例：
———————————————————————————–

 QTextCodec *gbk = QTextCodec::codecForName("gb18030");
 QTextCodec *utf8 = QTextCodec::codecForName("utf-8");

 QTextCodec::setCodecForTr(gbk);
 QTextCodec::setCodecForLocale(gbk);
 QTextCodec::setCodecForCStrings(gbk);


 QFile file("../test.txt");
 file.open(QIODevice::ReadOnly);
 QByteArray readByte = file.readAll();
 QString readStr = utf8->toUnicode(readByte.data());
 file.close();
 QString utfStr = QObject::trUtf8(readByte); //utf-8
 QString gbkStr = QObject::tr("中文"); // gbk

 QString utf2gbk = gbk->toUnicode(readStr.toLocal8Bit()); // utf8 conver gbk
 QString gbk2utf1 = utf8->toUnicode(utf2gbk.toUtf8()); // gbk convert utf8
 QString g2u = gbk->toUnicode(gbk->fromUnicode(readStr)); // gbk convert utf8

 qDebug() << "gbk:" << gbkStr;
 qDebug() << "utf8:" << utfStr;
 qDebug() << "readStr:" << readStr;

 qDebug() << "read_size:" << readByte.length();
 qDebug() << "utf2gbk:" <<utf2gbk << "length:" << readStr.toLocal8Bit().length();
 qDebug() << "gbk2utf8-1:" << gbk2utf1 << " length: " << utf2gbk.toUtf8().length();
 qDebug() << "g2u" << g2u << "length:" << gbk->fromUnicode(utfStr).length();

 QLabel *label = new QLabel(utf2gbk);
 label->show();

参考：

【1】http://www.cnblogs.com/bingcaihuang/archive/2011/03/17/1986714.html

【2】http://knight4576.blog.51cto.com/2761974/703963

No comments »

Posted in Code杂谈

Tags: Code杂谈 Qt开发字符集

Archive for the ‘Code杂谈’ category

curl分析请求耗时

Java Executor 框架使用的思考

elasticsearch 配置遇到的问题

参考:

basemap 尝鲜

参考

字符串乱码解决之道

代码示例：
———————————————————————————–

参考：

Recent Posts

热门文章

Archive for the ‘Code杂谈’ category

curl分析请求耗时

Java Executor 框架使用的思考

elasticsearch 配置遇到的问题

参考:

basemap 尝鲜

参考

字符串乱码解决之道

代码示例： ———————————————————————————–

参考：

Tags

Recent Posts

热门文章

代码示例：
———————————————————————————–