与“API”相关的文章 - 𝓍𝑜𝓎𝑜𝓏𝑜.𝓃𝑒𝓉

如何根据显卡配置选择合适尺寸的大模型

一般地，应选择尺寸小于显存的大模型版本，且适当冗余。

譬如，显存 8GB，选择尺寸为 5.2GB 的 deepseek-r1:8b。

这样，整个大模型都能被完整地读取到显存中。

若选择 9.0GB 的 deepseek-r1:14b 则显存不足，Ollama 会自动调用系统内存和 CPU 来协同工作，导致推理速度显著下降。

显卡的算力影响生成的速度，模型的参数决定生成的质量。

另外经实测，在 /api/generate 接口的 format 参数中设置返回的 JSON 格式，会缩短生成时间，降低生成质量，可能的原因是强制格式限制了词汇选择空间。

xoyozo 3 个月前

780

向基于 .NET Framework 框架开发的 Web 网站 POST 数据响应 405 Method Not Allowed

今天遇到一个向基于 .NET Framework 框架开发的 Web 网站 POST 数据响应 405 Method Not Allowed 的问题。

服务端接口地址是 https://***/api/abc/Default.aspx，

若请求 https://***/api/abc/Default.aspx 或 https://***/api/abc/ 则正常，

若请求 https://***/api/abc 就会出现这个问题。

原因可能是服务器可能返回 301 重定向到 https://***/api/abc/Default.aspx，

导致最终接口接受到的请求方法不是 POST 。

xoyozo 3 个月前

823

分享一个 Windows 资源管理器的文件名排序规则

using System.Runtime.InteropServices;

/// <summary>
/// Windows 资源管理器的文件名排序规则（允许在非 Windows 平台使用）
/// <para>调用 Windows API（StrCmpLogicalW 函数）实现，仅在 Windows 平台环境中使用</para>
/// <para>基本规则如下：</para>
/// <para>将文件名中的数字作为数值来处理。</para>
/// <para>不区分大小写。</para>
/// <para>字符类型的大致优先级顺序为：特殊符号 → 数字 → 字母。</para>
/// <para>对于中文文件名，排序方式取决于系统的区域设置：拼音(默认)、笔画。</para>
/// </summary>
public class FileLogicalComparer : IComparer<string>
{
    [DllImport("Shlwapi.dll", CharSet = CharSet.Unicode)]
    private static extern int StrCmpLogicalW(string psz1, string psz2);
    private static readonly bool IsWindows = RuntimeInformation.IsOSPlatform(OSPlatform.Windows);

    public int Compare(string? x, string? y)
    {
        // 处理 null 值情况
        if (x == null && y == null) return 0;
        if (x == null) return -1;
        if (y == null) return 1;

        try
        {
            if (IsWindows)
            {
                // Windows 平台：使用原生 API
                return StrCmpLogicalW(x, y);
            }
            else
            {
                // 非 Windows 平台：使用 C# 实现的回退方案
                return NaturalCompareFallback(x, y);
            }
        }
        catch (Exception) // 捕获 DllNotFound、EntryPointNotFoundException 等异常
        {
            // 异常时使用默认的字符串比较器
            return string.Compare(x, y, StringComparison.Ordinal);
        }
    }

    /// <summary>
    /// C# 实现的自然排序回退方案（代码来自 AI，未测试！）
    /// </summary>
    private static int NaturalCompareFallback(string x, string y)
    {
        if (x == y) return 0;

        int i = 0, j = 0;

        while (i < x.Length && j < y.Length)
        {
            if (char.IsDigit(x[i]) && char.IsDigit(y[j]))
            {
                // 提取连续数字并进行数值比较
                string num1 = ExtractNumber(x, ref i);
                string num2 = ExtractNumber(y, ref j);

                if (long.TryParse(num1, out long n1) && long.TryParse(num2, out long n2))
                {
                    if (n1 != n2)
                        return n1.CompareTo(n2);
                }
                else
                {
                    // 解析失败时按字符串比较
                    int strCompare = string.Compare(num1, num2, StringComparison.Ordinal);
                    if (strCompare != 0)
                        return strCompare;
                }
            }
            else
            {
                // 非数字字符直接比较
                if (x[i] != y[j])
                    return x[i].CompareTo(y[j]);

                i++;
                j++;
            }
        }

        return x.Length.CompareTo(y.Length);
    }

    /// <summary>
    /// 从字符串中提取连续的数字序列
    /// </summary>
    private static string ExtractNumber(string str, ref int index)
    {
        int start = index;
        while (index < str.Length && char.IsDigit(str[index]))
        {
            index++;
        }
        return str.Substring(start, index - start);
    }
}

xoyozo 4 个月前

2,191

Ollama 使用笔记

一、安装 Ollama

从官网下载安装 Ollama。

你可以更改大模型存放目录，也可以开放远程访问。

查看版本号：

ollama --version

二、在 shell 中安装和运行模型

在 Models 中选择一个你想部署的模型，复制安装命令，并在终端中执行。

官方建议：应该至少有 8 GB 的 RAM 来运行 7b 版本，16 GB 的 RAM 来运行 13b 版本，32 GB 的 RAM 来运行 33b 版本。

本文以 deepseek-r1:7b 为例。

下载模型

ollama pull deepseek-r1:7b

Tip: 下载即将完成时速度可能会变得非常慢，只要按 Ctrl+C，再重新执行一次命令，就会继续正常下载。

显示模型信息

ollama show deepseek-r1:7b

运行模型（一次性响应）

ollama run deepseek-r1:7b "写一首诗"

运行模型（进入聊天模式）

ollama run deepseek-r1:7b

结束当前会话

/bye

列出所有模型

ollama list

列出当前加载的模型

ollama ps

停止当前正在运行的模型

ollama stop deepseek-r1:7b

删除一个模型

ollama rm deepseek-r1:7b

三、使用 REST API 调用模型

修改端口

ollama serve --port 11434

/api/generate 接口：生成一次性响应

curl http://localhost:11434/api/generate -d '{
  "model": "deepseek-r1:7b",
  "prompt":"为什么天空是蓝色的？"
}'

/api/chat 接口：与模型聊天

curl http://localhost:11434/api/chat -d '{
  "model": "deepseek-r1:7b",
  "messages": [
    { "role": "user", "content": "你好呀！" }
  ]
}'

四、在 .NET 中调用

1、直接 HTTP 调用（基础方案）

创建 HttpClient，使用 PostAsJsonAsync 请求，使用 ReadFromJsonAsync 读取结果。

2、使用 OllamaSharp 库（推荐方案）

创建 OllamaApiClient，使用 SelectedModel 设置模型，使用 GenerateAsync 获得结果。或创建对话 ollama.Chat()，并 Send 内容。

3、.NET Aspire 集成（企业级方案）

适合微服务架构，结合容器化部署。

“OllamaSharp 库”和“.NET Aspire 集成”两种方案怎么选？

OllamaSharp 库：定位轻量级模型交互 SDK，适用于独立应用、微服务中的 AI 组件等场景，技术复度低，支持模型对话/生成/管理、流式响应、多模态支持，需自行实现监控、熔断。

.NET Aspire 集成：定位企业级云原生 AI 服务编排框架，适用于多服务协同的分布式系统，技术复度高，支持服务编排、健康检查、弹性伸缩、混合云部署，内置可观测性仪表盘、自动故障转移。

决策建议：初创项目用 OllamaSharp 快速试错，用户量破千后通过 Aspire 重构。两者并非互斥，可在 Aspire 中封装 OllamaSharp 客户端，兼顾灵活性与运维能力。

xoyozo 7 个月前

4,933

C# 中的锁

临界区与 lock 关键字
核心作用：
通过将多线程访问串行化，保护共享资源或代码段。lock 关键字是 Monitor 类的语法糖，提供异常安全的临界区实现。
实现示例：
```
// 创建私有静态只读对象
// private static readonly object _lockObj = new object();
private static readonly System.Threading.Lock _locker = new(); // .NET 9+ 推荐使用 Lock 类型，避免传统 object 的性能损耗

public void ThreadSafeMethod()
{
    lock (_lockObj) 
    {
        // 临界区代码（每次仅一个线程可进入）
    }
}
```
超时机制：
高并发场景可结合 Monitor.TryEnter 设置超时，避免无限等待：
```
if (Monitor.TryEnter(lockObject, TimeSpan.FromSeconds(1)))
{
    try { /* 操作 */ }
    finally { Monitor.Exit(lockObject); }
}
```
关键特性：
用户态锁（无内核切换开销）
自动调用Monitor.Enter和Monitor.Exit
必须使用专用私有对象作为锁标识
注意事项：
❌ 避免锁定this、Type实例或字符串（易引发死锁）
❌ 避免嵌套锁（需严格按顺序释放）
✅ 推荐readonly修饰锁对象
❌ lock 不适用于异步代码（async/await），需使用 SemaphoreSlim 实现异步锁
lock 示例
互斥锁（Mutex）
核心作用：
系统级内核锁，支持跨进程同步，但性能开销较高（用户态/内核态切换）。
实现示例：
```
using var mutex = new Mutex(false, "Global\\MyAppMutex");

try 
{
    // 等待锁（最大等待时间500ms）
    if (mutex.WaitOne(500)) 
    {
        // 临界区代码
    }
}
finally 
{
    if (mutex != null)
    {
        mutex.ReleaseMutex();
    }
}
```
关键特性：
支持跨应用程序域同步
线程终止时自动释放锁
支持命名互斥体（系统全局可见）
适用场景：
单实例应用程序控制
进程间共享文件访问
硬件设备独占访问
Mutex 示例

信号量（Semaphore）

核心作用：

通过许可计数器控制并发线程数，SemaphoreSlim为轻量级版本（用户态实现）。

实现对比：

类型	跨进程	性能	最大许可数
Semaphore	✔️	低	系统限制
SemaphoreSlim	❌	高	Int32.Max

代码示例：

// 创建初始3许可、最大5许可的信号量
var semaphore = new SemaphoreSlim(3, 5);

semaphore.Wait();  // 获取许可
try 
{
    // 资源访问代码
}
finally 
{
    semaphore.Release();
}

异步编程

private readonly SemaphoreSlim _asyncLock = new(1, 1);
public async Task UpdateAsync()
{
    await _asyncLock.WaitAsync();
    try { /* 异步操作 */ }
    finally { _asyncLock.Release(); }
}

典型应用：

数据库连接池（限制最大连接数）

API 请求限流

批量任务并发控制

Semaphore 示例

事件（Event）
核心机制：
通过信号机制实现线程间通知，分为两种类型：
类型
信号重置方式
唤醒线程数
AutoResetEvent
自动
单个
ManualResetEvent
手动
所有
使用示例：
```
var autoEvent = new AutoResetEvent(false);

// 等待线程
Task.Run(() => 
{
    autoEvent.WaitOne();
    // 收到信号后执行
});

// 信号发送线程
autoEvent.Set();  // 唤醒一个等待线程
```
高级用法：
配合WaitHandle.WaitAll实现多事件等待
使用ManualResetEventSlim提升性能
AutoResetEvent 示例
读写锁（ReaderWriterLockSlim）
核心优势：
实现读写分离的并发策略，适合读多写少场景（如缓存系统）。
锁模式对比：
模式
并发性
升级支持
读模式(EnterReadLock)
多线程并发读
❌
写模式(EnterWriteLock)
独占访问
❌
可升级模式
单线程读→写
✔️
代码示例：
```
var rwLock = new ReaderWriterLockSlim();

// 读操作
rwLock.EnterReadLock();
try 
{
    // 只读访问
}
finally 
{
    rwLock.ExitReadLock();
}

// 写操作
rwLock.EnterWriteLock();
try 
{
    // 排他写入
}
finally 
{
    rwLock.ExitWriteLock();
}
```
最佳实践：
优先使用ReaderWriterLockSlim（旧版有死锁风险）
避免长时间持有读锁（可能饿死写线程）
ReaderWriterLockSlim 示例

原子操作（Interlocked）

原理：

通过CPU指令实现无锁线程安全操作。

常用方法：

int counter = 0;
Interlocked.Increment(ref counter);      // 原子递增
Interlocked.Decrement(ref counter);      // 原子递减
Interlocked.CompareExchange(ref value, newVal, oldVal);  // CAS操作

适用场景：

简单计数器

标志位状态切换

无锁数据结构实现

自旋锁（SpinLock）

核心特点：

通过忙等待（busy-wait）避免上下文切换，适用极短临界区（<1微秒）。

实现示例：

private SpinLock _spinLock = new SpinLock();

public void CriticalOperation()
{
    bool lockTaken = false;
    try 
    {
        _spinLock.Enter(ref lockTaken);
        // 极短临界区代码
    }
    finally 
    {
        if (lockTaken) _spinLock.Exit();
    }
}

优化技巧：

单核CPU需调用Thread.SpinWait或Thread.Yield

配合SpinWait结构实现自适应等待

同步机制对比指南

机制	跨进程	开销级别	最佳适用场景
lock	❌	低	通用临界区保护
Mutex	✔️	高	进程间资源独占
Semaphore	✔️	中	并发数限制（跨进程）
SemaphoreSlim	❌	低	并发数限制（进程内）
ReaderWriterLockSlim	❌	中	读多写少场景
SpinLock	❌	极低	纳秒级临界区
Interlocked	-	无锁	简单原子操作

选择原则：

优先考虑用户态锁（lock/SpinLock/SemaphoreSlim）
跨进程需求必须使用内核对象（Mutex/Semaphore）
读写比例超过10:1时考虑读写锁
自旋锁仅用于高频短操作（如链表指针修改）

通过以上结构化的分类和对比，开发者可以更精准地选择适合特定场景的线程同步方案。建议在实际使用中配合性能分析工具（如BenchmarkDotNet）进行量化验证。

💡 ASP.NET 的异步编程（async/await）本质是单进程内的线程调度，不算“跨进程”。每个 IIS 应用程序池对应一个独立的工作进程（w3wp.exe），不同用户访问同一应用程序池下的 ASP.NET 网站，两者的请求均由同一个 w3wp.exe 进程处理。可能跨进程的场景有：Web Garden 配置、多应用程序池部署等。

在 C# 中，除了常规锁机制（如 lock、Mutex、Semaphore 等），还有一些内置类型通过内部锁或无锁设计实现线程安全。以下是常见的几类：

线程安全集合（System.Collections.Concurrent）这些集合通过细粒度锁或无锁算法（如 CAS）实现线程安全，适合高并发场景。

ConcurrentDictionary：分段锁机制，将数据分片存储，每个分片独立加锁，减少锁竞争。
ConcurrentQueue / ConcurrentStack：基于原子操作（Interlocked）保证线程安全。
ConcurrentBag：每个线程维护本地存储，减少争用，适合频繁添加和移除的场景。
BlockingCollection：基于 ConcurrentQueue 和信号量（SemaphoreSlim）实现生产-消费者模式，支持阻塞和超时。

不可变集合（System.Collections.Immutable） 通过数据不可变性实现线程安全（无需锁），每次修改返回新对象。
Lazy 的线程安全初始化（Lazy<T>） 通过锁或 Interlocked 确保延迟初始化的线程安全。
通道（System.Threading.Channels）用于异步生产-消费者模型，内部通过锁和信号量管理容量限制。
内存缓存（System.Runtime.Caching.MemoryCache）内部使用锁保护共享状态，确保线程安全。
原子操作类型（Interlocked 类、Volatile 关键字、Unsafe 类）通过 CPU 指令实现无锁线程安全。
其他同步工具（Barrier、CountdownEvent）虽然不是严格意义上的锁，但用于协调线程。

xoyozo 9 个月前

3,487

推荐个人使用的股票数据接口

数据库	数据类型	收费情况	调用方式	数据来源	资料
BaoStock	仅提供历史数据（如日线、周线），无实时行情	免费开源	Python	数据来源为交易所或合作机构的标准化接口	文档
AkShare	股票、期货、债券、期权、外汇、货币、指数……	免费开源	Python / Anaconda / R / MATLAB / 本地 Web API	基于爬虫技术从大型财经网站抓取公开数据包含北交所行情数据	文档 / 数据字典 / AKTools
Tushare Pro	股票、指数、公募、期货、期权、债券、外汇、港股、美股……	免费 / 收费	Web API / Python / Matlab / R	通过社区的采集和整理存入数据库经过质量控制后再提供给用户包含北交所行情数据	积分 / 权限 / 文档
麦蕊智数	沪深股票基础数据、实时交易数据、指数数据	免费 / 收费	Web API		licence / 文档
JoinQuant/JQData	股票、基金等行情数据	试用 / 收费	Python		文档

xoyozo 10 个月前

2,573

我遇到过的一些 TeaException

Tea.TeaException:“code: 400, Specified parameter Version is not valid. request id: ”

可能是 AlibabaCloud.OpenApiClient.Models.Config 的 Endpoint 配置错误。

Tea.TeaException:“code: 400, The parameter IpProtocol must be specified with case insensitive TCP, UDP, ICMP, GRE or All. request id: ”

必须指定 Permissions 参数。参考文档

Tea.TeaException:“code: 403, User not authorized to operate on the specified resource, or this API doesn't support RAM. request id: ”

前往 RAM 访问控制配置用户的权限。

Tea.TeaException:“code: 401, The specified security group is not authorized to operate. request id: ”

没有权限操作当前安全组。或者检查安全组的实例 ID 是否正确。

本文不定期更新。

xoyozo 11 个月前

1,301

浅谈接口认证

本文介绍 Token 认证和 HMAC 认证两种方式。

一、Token 接口认证方式

原理：

客户端使用账号密码等信息登录，服务器验证通过后生成一个 Token 发送给客户端。客户端在后续的请求中携带这个 Token，服务器通过验证 Token 来确认用户的身份和权限。

应用场景：移动应用、Web 应用（特别是 SPA）

优点：

无状态性，即服务器不需要存储用户的会话信息。

易于实现跨域认证。

缺点：

Token 可能被窃取，应使用 HTTPS、不暴露在 URL 中、使用 HttpOnly 的 Cookie、对 Session ID 进行验证、设置合理过期时间、对 Token 进行加密等措施加强防范。

二、HMAC 接口认证方式

原理：

客户端将消息M与密钥K连接起来，通过哈希函数计算得到 HMAC 值，发送给服务器。服务器收到请求后，使用相同的密钥和请求参数重新计算 HMAC 值，如果与客户端发送的签名一致，即是合法请求。

优点：

安全性较高，攻击者很难伪造 HMAC 值，截获并篡改数据也无法通过服务端验证。

计算效率较高，哈希函数（如 MD5、SHA-1、SHA-256 等）计算效率比较高。

缺点：

密钥的更新和管理比较麻烦。

扩展：

在消息体中添加时间戳以防止重放攻击。

加密隐私数据：可以使用对称加密算法（如 AES）或非对称加密算法（如 RSA、ECC 等）对部分隐私数据进行加密。非对称算法虽然更安全，但速度较慢，如需加密大量数据，可以考虑使用对称加密算法进行加密，然后使用非对称加密算法对对称密钥进行加密。

xoyozo 1 年前

2,534

在 access_by_lua_block 获取系统 CPU 使用率

http {
    ...

    lua_shared_dict cpu_cache 1m;  # 定义共享字典用于缓存 CPU 使用率
    access_by_lua_block {
        local cpu_cache = ngx.shared.cpu_cache
        local cache_time = cpu_cache:get("cache_time") or 0
        local current_time = ngx.now()

        if current_time - cache_time > 5 then  -- 每 5 秒更新一次
            local cpu_info = io.popen("top -bn1 | grep 'Cpu(s)'"):read("*all")
            local cpu_usage = cpu_info:match("(%d+%.%d+) id")  -- 获取空闲 CPU 百分比
            local cpu_used = 100 - tonumber(cpu_usage)  -- 计算使用率

            cpu_cache:set("cpu_usage", cpu_used)
            cpu_cache:set("cache_time", current_time)
        end

        local cpu_usage = cpu_cache:get("cpu_usage")
        ngx.log(ngx.INFO, "CPU 使用率: " .. cpu_usage .. "%")
        -- 将 cpu_usage 发送到远程鉴权接口，可根据服务器压力来决定是否拒绝一些不重要的请求
    }
}

代码解析：

共享字典：使用 lua_shared_dict 定义一个共享字典 cpu_cache，用于存储 CPU 使用率和缓存时间。

获取 CPU 使用率：在 access_by_lua_block 中，检查缓存时间，如果超过 5 秒，则重新获取 CPU 使用率，并更新共享字典。

记录日志：使用 ngx.log 将 CPU 使用率记录到 Nginx 日志中。

注意事项：

确保 Nginx 配置中已经加载了 Lua 模块（如 ngx_http_lua_module）。

根据实际需求调整缓存时间，以平衡性能和数据的实时性。

尝试过使用 ifconfig 或 ip 命令获取网卡流量，在宝塔面板中失败了，怀疑是权限问题，有空再研究。临时方案是鉴权接口定时调用宝塔面板 API 或阿里云控制台 API 来获取 ECS 的 CPU 和带宽使用率。

如何配置 nginx 远程鉴权

xoyozo 1 年前

939

nginx 通过一个远程接口鉴权

鉴权方式有许多，譬如可以用 lua 的 access_by_lua 来实现，这里用 nginx 自带的 auth_request，虽然功能简单，但效率更高。

第一步，确保 nginx 已编译安装 auth_request 模块，见此文。

第二步，打开需要鉴权的网站的 nginx 配置文件，添加以下代码块：

    #鉴权-START
    location / {
        auth_request /auth;
        error_page 403 = @error403;
        
        #PHP-INFO-START  PHP引用配置，可以注释或修改
        include enable-php-**.conf;
        #PHP-INFO-END
    }
    location = /auth {
        internal;
        proxy_pass https://鉴权地址;
        proxy_pass_request_body off;
        proxy_set_header Content-Length "";
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header User-Agent $http_user_agent;
        proxy_set_header X-Forwarded-Host $host;
        proxy_set_header X-Forwarded-Uri $request_uri;
        proxy_intercept_errors on;
        #proxy_read_timeout 1s; # 超时会报 500
    }
    location @error403 {
        #default_type text/plain;
        #return 403 'forbidden';
        return 302 https://一个显示403友好信息的页面.html;
    }
    #鉴权-END

一般放在所有的 location 之前。

这里自定义请求头 X-Forwarded-Host 与 X-Forwarded-Uri 用来传递 host 与 uri。API 应从 Header 中相应取值。

宝塔面板中是通过 include enable-php-**.conf; 的方式调用 PHP ，那么可以将此行移入上面的 location / 代码块中，因为此代码块能匹配所有的请求路径。

最后，若鉴权接口在私网中，将鉴权接口域名和私网 IP 添加到 hosts 文件中。

xoyozo 1 年前

1,541

1 2 3 4 5

大家在看

最新发布

类型	信号重置方式	唤醒线程数
AutoResetEvent	自动	单个
ManualResetEvent	手动	所有

模式	并发性	升级支持
读模式(EnterReadLock)	多线程并发读	❌
写模式(EnterWriteLock)	独占访问	❌
可升级模式	单线程读→写	✔️

查询 / 检测

编程

前端

行业

本站 API

博客 (64)

大家在看

最新发布