Java中的线程创建会带来显著的开销。创建线程消耗时间,增加了请求处理的延迟,并涉及JVM和操作系统的大量工作。为了减轻这些开销,引入了线程池的概念。
在本文中,我们深入探讨确定理想线程池大小的艺术。一个经过精心调整的线程池可以从系统中提取出最佳性能,并帮助你在高峰工作负载中优雅地导航。然而,必须记住,即使使用线程池,线程的管理本身也可能成为瓶颈。
在确定线程池大小时,了解系统的限制,包括硬件和外部依赖项,是至关重要的。让我们通过一个例子详细说明这个概念:
假设你正在开发一个处理传入HTTP请求的Web应用程序。每个请求可能涉及从数据库处理数据并调用外部第三方服务。你的目标是确定有效的线程池大小以有效处理这些请求。
数据库连接池:假设你正在使用像HikariCP这样的连接池来管理数据库连接。你已将其配置为允许最多100个连接。如果创建的线程多于可用连接,这些额外的线程将等待可用连接,导致资源争用和潜在的性能问题。
下面是配置HikariCP数据库连接池的示例:
import com.zaxxer.hikari.HikariConfig;import com.zaxxer.hikari.HikariDataSource;public class DatabaseConnectionExample { public static void main(String[] args) { HikariConfig config = new HikariConfig(); config.setJdbcUrl("jdbc:mysql://localhost:3306/mydb"); config.setUsername("username"); config.setPassword("password"); config.setMaximumPoolSize(100); // 设置最大连接数 HikariDataSource dataSource = new HikariDataSource(config); // 使用dataSource获取数据库连接并执行查询。 }}
外部服务吞吐量:你的应用程序与之交互的外部服务有一个限制。它只能同时处理少量请求,例如一次处理10个请求。同时发送更多请求可能会***使服务不堪重负,导致性能下降或错误***。
CPU核心:确定服务器上可用的CPU核心数量对于优化线程池大小至关重要。
int numOfCores = Runtime.getRuntime().availableProcessors();
每个核心可以同时执行一个线程。超过CPU核心数的线程可能导致过多的上下文切换,从而降低性能。
CPU密集型任务是那些需要大量处理能力的任务,例如执行复杂计算或运行模拟。这些任务通常受限于CPU速度,而不是I/O设备的速度。
假设你有一个大型的数字数组,并且想要利用多个线程并行地计算每个数字的平方。
import java.util.concurrent.ExecutorService;import java.util.concurrent.Executors;import java.util.concurrent.TimeUnit;public class ParallelSquareCalculator { public static void main(String[] args) { int[] numbers = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}; int numThreads = Runtime.getRuntime().availableProcessors(); // 获取CPU核心数 ExecutorService executorService = Executors.newFixedThreadPool(numThreads); for (int number : numbers) { executorService.submit(() -> { int square = calculateSquare(number); System.out.println("Square of " + number + " is " + square); }); } executorService.shutdown(); try { executorService.awaitTermination(Long.MAX_VALUE, TimeUnit.NANOSECONDS); } catch (InterruptedException e) { Thread.currentThread().interrupt(); } } private static int calculateSquare(int number) { // 模拟耗时的计算(例如,数据库查询,复杂计算) try { Thread.sleep(1000); // 模拟1秒延迟 } catch (InterruptedException e) { Thread.currentThread().interrupt(); } return number * number; }}
I/O密集型任务是
那些与存储设备交互(例如,读/写文件),网络套接字(例如,发起API调用)或用户输入(例如,图形用户界面中的用户交互)的任务。
对于CPU绑定的任务,你希望在不过分负担系统的情况下最大化CPU利用率,过多的线程可能导致过多的上下文切换,从而降低性能。一个常见的经验法则是使用可用的CPU核心数。
想象一下,你正在开发一个视频处理应用程序。视频编码是一个CPU密集型任务,你需要对视频文件应用复杂的算法进行压缩。你有一个多核CPU可用。
import java.util.concurrent.ExecutorService;import java.util.concurrent.Executors;public class VideoEncodingApp { public static void main(String[] args) { int availableCores = Runtime.getRuntime().availableProcessors(); int numberOfThreads = Math.max(availableCores - 1, 1); // 根据需要调整 ExecutorService threadPool = Executors.newFixedThreadPool(numberOfThreads); // 将视频编码任务提交到线程池。 for (int i = 0; i < 10; i++) { threadPool.execute(() -> { encodeVideo(); // 模拟视频编码任务 }); } threadPool.shutdown(); } private static void encodeVideo() { // 模拟视频编码(CPU绑定)任务。 // 复杂的计算和压缩算法在这里。 }}
对于I/O绑定的任务,理想的线程数通常取决于I/O操作的性质和预期的延迟。你希望有足够的线程使I/O设备保持繁忙,而不会过载它们。理想的数字可能不一定等于CPU核心数。
考虑构建一个下载网页并提取信息的网络爬虫。这涉及进行I/O绑定的任务,由于网络延迟,可能需要发出HTTP请求。
import java.util.concurrent.ExecutorService;import java.util.concurrent.Executors;public class WebPageCrawler { public static void main(String[] args) { int expectedIOLatency = 500; // 估计的I/O延迟,单位毫秒 int numberOfThreads = 4; // 根据预期的延迟和系统能力进行调整 ExecutorService threadPool = Executors.newFixedThreadPool(numberOfThreads); // 要爬取的URL列表。 String[] urlsToCrawl = { "https://example.com", "https://google.com", "https://github.com", // 在此添加更多的URL }; for (String url : urlsToCrawl) { threadPool.execute(() -> { crawlWebPage(url, expectedIOLatency); }); } threadPool.shutdown(); } private static void crawlWebPage(String url, int expectedIOLatency) { // 模拟网页爬取(I/O绑定)任务。 // 执行HTTP请求并处理页面内容。 try { Thread.sleep(expectedIOLatency); // 模拟I/O延迟 } catch (InterruptedException e) { Thread.currentThread().interrupt(); } }}
确定线程池大小的公式可以写成如下:
Number of threads = Number of Available Cores * Target CPU utilization * (1 + Wait time / Service time)
Number of Available Cores: 这是你的应用程序可用的***CPU核心数***。重要的是要注意,这与CPU数不同,因为***每个CPU可能有多个核心。***
Target CPU utilization: 这是你希望你的应用程序使用的CPU时间的百分比***。如果设置目标CPU利用率过高,你的应用程序可能会变得无响应*。如果设置得太低,你的应用程序将无法充分利用可用的CPU资源。
Wait time: 这是***线程等待I/O操作完成的时间***。这可能包括***等待网络响应、数据库查询或文件操作。***
Service time: 这是***线程执行计算的时间***。
Blocking coefficient: 这是等待时间与服务时间的比率。这是衡量线程等待I/O操作完成所花费的时间与执行计算所花费的时间之间关系的指标。
假设你有一台具有4个CPU核心的服务器,并且你希望你的应用程序使用可用CPU资源的50%。
你的应用程序有两类任务:I/O密集型任务和CPU密集型任务。
I/O密集型任务的阻塞系数为0.5,意味着它们花费50%的时间等待I/O操作完成。
线程数 = 4个核心 * 0.5 * (1 + 0.5) = 3个线程
CPU密集型任务的阻塞系数为0.1,意味着它们花费10%的时间等待I/O操作完成。
线程数 = 4个核心 * 0.5 * (1 + 0.1) = 2.2个线程
在这个例子中,你将创建两个线程池,一个用于I/O密集型任务,一个用于CPU密集型任务。I/O密集型线程池将有3个线程,而CPU密集型线程池将有2个线程。
本文链接:http://www.28at.com/showinfo-26-58899-0.html线程池系统设置最全指南!
声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。